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@ Die Erfindung betrifft eine DNA-Sequenz, die fur ein 
synthetisches Spinnenseidenprotein kodiert, rekombi- 
nante Spinnenseidenproteine, die durch die erfindungs- 
gemaGe DNA-Sequenz kodiert sind, Verfahren zur Her- 
stellung von Pflanzen bzw. Pflanzenzellen, die rekombi- 
nantes Spinnenseidenprotein enthalten sowie transgene 
Pflanzenzellen und Pflanzen, die eine DNA-Sequenz ent- 
halten, die fur ein synthetisches Spinnenseidenprotein 
kodiert. Des weiteren betrifft die Erfindung ein Verfahren 
zur Gewinnung von pflanzlichem Spinnenseidenprotein 
aus transgenen Pflanzen sowie pfianzliche Spinnensei- 
denproteine, die nach einem derartigen Verfahren herge- 
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Beschreibung 

|0001] Die Erfindung betrifft eine DNA-Sequenz, die fiir ein synthetisches Spinnenseidenprotein kodiert, rekombi- 
nante Spinnenseidenproteine, die durch die erfindungsgemaBe DNA-Sequenz kodiert sind, Verfahren zur Herstellung 
5 von Pflanzen bzw. Pflanzenzellen, die rekombin antes Spinnenseidenprotein enthalten sowie transgene Pflanzenzellen 
und Pflanzen, die eine DNA-Sequenz enthalten, die fur ein synthetisches Spinnenseidenprotein kodiert. Des weiteren be- 
trifft die Erfindung ein Verfahren zur Gewinnung von pflanzlichem Spinnenseidenprotein aus transgenen Pflanzen sowie 
pflanzliche Spinnenseidenproteine, die nach einem derartigen Verfahren hergestellt worden sind. 
RN:MH:uh 

10 [0002] Spinnenseide weisl hervorragende mechanische Eigenschaften auf, die jene vieler bekannter naturlicher und 
kiinstlicher Materialien ubertrifft. Hauptbestandteile der Spinnenseide sind Faserproteine wie beispielsweise Fibroin aus 
dem Seidenspinner sowie Spidroin 1 und Spidroin 2 aus Nephila clavipes. Die Festigkeit und Elastizitat der Seide beruht 
auf der Gegenwart von kurzen repetitiven Aminosaure-Einheiten, die in diesen naturlichen Proteinen vorliegen. Diese 
mechanischen Eigenschaften pradestinieren die Spinnenseide fur eine Reihe von verschiedensten technischen Anwen- 

15 dungen wie beispielsweise die Herstellung von stabilen Faden bzw. Seiden. Femer verfiigen die Spinnenseidenfaden auf- 
grund ihrer proteinchemischen Eigenschaften uber ein geringes immunogenes und allergenes Potential, weshalb sich in 
Kombination mit den mechanischen Eigenschaften eine Anwendung in der Medizin beispielsweise als naturliches Garn 
zum Vemahen von Wunden, als Anheftungsflachen fur kultivierte Zeilen, als Geriiste fiir klinstliche Organe und derglei- 
chen anbietet. 

20 [0003] Voraussetzung fiir eine derartige technische bzw. medizinische Nutzung der Spinnenseide ist jedoch die Her- 
stellung von Spinnenfaden bzw. Spinnenseidenproteinen in groBem MaBstab. Zu diesem Zweck wurde bislang versucht, 
die fiir die Produktion der Spinnenseide verantwortlichen Spidroin- bzw. Fibroingene in E. coli zu exprimieren. Die sich 
haufig wiederholenden Sequenzen in den entsprechenden Genen gehen jedoch bei der Reproduktion in Bakterien nach 
und nach verloren. Ein wei teres Problem ist die GroBe der genetischen Information, die fiir das Bakterium zu umfang- 

25 reich zu sein scheint, so daB die Spinnenseiden-Gene nicht iminer vollstandig ausgelesen werden. 

[0004] Versuche der Expression in Hefezelien ergaben zwar stabilere und langere Seidenproteine, die Faden, die dar- 
aus gesponnen wurden, weisen jedoch nicht die selben vorteilhaften Eigenschaften der naturlichen Seide auf, so daB bei- 
spielsweise eine medizinische Anwendung einer derart synthetisch hergestellten Seide nicht moglich ist. Es besteht so- 
mit ein Bedarf an synthetischen Seidenproteinen, die in technischem MaBstab hergestellt werden konnen und nach dem 

30 Verspinnen zu Faden mechanische Eigenschaften aufweisen, die mit jenen der naturlichen Seide vergleichbar sind. 

[0005] Aufgabe der vorliegenden Erfindung ist es deshalb, DNA-Sequenzen bereitzustellen, die fur ein synthetisches 
Spinnenseidenprotein kodieren, das eine moglichst groBe Ahnlichkeit mit den bisher bekannten naturlichen Sequenzen 
von Faserproteinen der Spinnenseide aufweist. Ferner ist es Aufgabe der vorliegenden Erfindung, ein Verfahren bereit- 
zustellen, mit dem synthetische Spinnenseidenproteine in groBem MaBstab hergestellt werden konnen. 

35 [0006] Weitere Aufgabcn der vorliegenden Erfindung ergeben sich aus der folgenden Beschreibung. 

[0007] Oben genannte Aufgaben werden durch die Merkmale der unabhangigen Schutzanspruche gelost. 
[0008] Vorteilhafte Ausgestaltungen sind in den Unteranspruchen definiert. 

[0009] Im Rahmen der vorliegenden Erfindung wird jetzt eine DNA-Sequenz ofFenbart, die fiir ein synthetisches Fa- 
serprotein, insbesondere ein synthetisches Spinnenseidenprotein kodiert, das eine mindestens 80%ige, vorzugsweise 
40 mindestens 84%ige, mehr bevorzugt mindestens 88%ige, besonders bevorzugt mindestens 90%ige und 92%ige, am mei- 
sten bevorzugt mindestens 94%ige Homoiogie zu Spidroin- und/oder Fibroin-Proteinen, insbesondere zu dem Spidroin 
1 -Protein, besonders bevorzugt zu dem Spidroin 1 -Protein aus Nephila clavipes aufweist. 

[0010] Homoiogie bedeutet im Rahmen dieser Erfindung Ahnlichkeit zwischen Aminosauresequenzen aufgrund von 
identischen bzw. homologen Aminosaurebausteinen. Welche Aminosauren als homolog anzusehen sind, ist dem Fach- 
45 mann bekannt, z. B. (i) Isoleucin, Leucin und Valin untereinander, (ii) Asparagin und Glutamin, (iii) Asparaginsaure und 
Glutaminsaure. 

[0011] Die erfindungsgemaBe DNA-Sequenz ist aus Modulen aufgebaut, die eine Gruppe von aneinandergereihten Oli- 
gonukleotidsequenzen umfassen, wobei die Oligonukleotidscquenzen jeweils fiir repetitive Einheiten aus Spidroin- und/ 
oder Fibroin-Proteinen kodieren. 

50 [0012] Der Aufbau der erfindungsgemaBen DNA-Sequenz aus verschiedenen Modulen, welche wiederum aus unter- 
schiedlichen, fiir Spidroine bzw. Fibroine typischen kurzen Aminosaure-Repeats konstruiert sind, wobei sich das Prinzip 
der Aneinanderreihung der entsprechenden Oligonukleotidsequenzen bzw. der Module an naturlichen Spidroin- und/ 
oder Fibroin-Sequenzen orientiert, gewahrleistet eine sehr hohe Homoiogie zu bisher bekannten naturlichen Spidroin- 
bzw. Fibroin-Sequenzen. Dadurch wird sichergestelit, daB die durch die erfindungsgemaBe DNA-Sequenz kodierten 

55 Spinnenseidenproteine nach dem Verspinnen zu Faden hervorragende mechanische Eigenschaften bezuglich ihrer Fe- 
stigkeit und Elastizitat aufweisen, die mit den mechanischen Eigenschaften von naturlichen Spinnenfaden vergleichbar 
sind. 

[0013] Des weiteren ermoglicht der modulartige Aufbau der erfindungsgemaBen DNA-Sequenz eine einfache gentech- 
nische Modifizierung der synthetischen Gene, so daB Multimere von synthetischen Spinnenseidenproteinen mit beliebi- 
60 ger GroBe je nach Wunsch hergestellt werden konnen. Ferner konnen die durch die erfindungsgemaBe DNA-Sequenz ko- 
dierten Spinnenseidenproteine aufgrund des modulartigen Aufbaus mit anderen Faserproteinsequenzen fusioniert wer- 
den. Ein besonderer Vorteil der erfindungsgemaBen DNA-Sequenz ist, daB sie aufgrund ihres modulartigen Aufbaus auf 
einfache Weise mit fiir Reinigungselemente oder Loslichkeits-verandemde Peptide kodierenden Sequenzen fusioniert 
werden kann. 

65 [0014] Bei einer besonders bevorzugten Ausfuhrungsform der vorliegenden Erfindung weist das durch die erfindungs- 
gemaBe DNA-Sequenz kodierte Spinnenseidenprotein eine mindestens 84%ige, vorzugsweise mindestens 90%ige und 
besonders bevorzugt mindestens 94%ige Homoiogie zu dem Spidroin 1 -Protein aus Nephila clavipes auf. Spidroin 1 aus 
Nephila clavipes ist wesentlich am Aufbau eines mechanisch besonders stabilen und elastischen Tragfadens beteiligt. 
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[0015] Aufgrund des modulartigen Aufbaus der erfindungsgemaBen DNA-Sequenz ist die Konstruktion von Genen, 
die sehr groBe Spinnenseidenproteine kodicrcn, ohnc wcitcrcs moglich, wobei die hohc Homologie zu Spidroin- und/ 
oder Fibroin-Proteinen, insbesondere zu Spidroin 1, besonders bevorzugt zu Spidroin 1 von Nephila clavipes immer er- 
h alien bleibt. Die so erzielbare GroBenverteilung der durch die erfindungsgemaBen DNA-Sequenzen kodierten Proteine 
entspricht dem Spektrum von Spinnenseidenproteinen, das nach der Auflosung von natiirlicher Spinnenseide beobachten 5 
werden kann. Dieses identische GroBenspektrum sowie die hohe Sequenzhomologie definieren die erfindungsgemaBen 
synthelischen Gene als Gene, die fur Spinnenseidenproteine kodieren. Im Gegensatz zu natiirlicher Spinnenseide, die aus 
einem Gemisch von Spinnenseidenproteinen besteht, werden durch die vorliegende Erfindung Spinnenseidenprotein- 
Gene bereitgestellt, die mit hoher Homologie eine Genklasse reprasentieren und eine einfache gentechnische Manipula- 
tion crlaubcn. 10 
[0016] Die Module zum Aufbau der erfindungsgemaBen DNA-Sequenz umfassen eine Gruppe von aneinandergereih- 
ten Oligonukleotidsequenzen, die vorzugsweise ausgewahlt sind aus der Gruppe, bestehend aus: 

a) TATG A GCGCTCCCGGGC AGGGT, 

b) AGCTTTTAGGTACCAATATTAATCTGGCCGGCTCCACC; 15 

c) TATGGTCTGGGG; 

d) GGCCAGGGTGCTGGCCAA; 

e) GGTGCAGGAGCWGCW GCWGCWGCTGCAGGTGG A; 
0 GGCGGCCAG ATTAATATTGGTACCTAAA ; 

g) CTGCCCGGGAGCGCTCA; 20 

h) ACCACCATAACCTCC; 

i) AGCACCCTGGCCCCCCAG; 

j) TGCAGCWGCWGCWGCWGCTCCTGCACCTTGGCC; 
k) TATGAGATCTGGCCAAGGAGGT; 

1) rTGGCCAGATCTCA; 25 

m) AGTC AGGGTGCTGGTCGTGG AGGCCAA ; 

n) TCCACGACCAGCACCCTGACTCCCCAG; 

o) AGTCAGGGCGCTGGTCGTGGGGGACTGGGTGGCCAA; 

p) ACCCAGIXJCCCCACGACCAGGGCCCTGACTCCCCAG; 

q) CTGGG AGGGC AGGG AGCGGGCCAA ; 30 
r) CGCTCCCTGCCCTCCCAGACCTCC; und 

s) Sequenzen, die zu den Sequenzen a) bis r) eine mindestens 80%ige, vorzugsweise mindestens 90%ige, beson- 
ders bevorzugt mindestens 94%ige Sequenzidentitat aufweisen. 

[0017] Die Module umfassen vorzugsweise mindestens vier Oligonukleotidsequenzen, die sich vorzugsweise unter- 35 
scheiden, um die nattirlichen Spinnenseidenproteine auf aulhentische Weise nachzugestalten. Die erfindungsgemaBe 
DNA-Sequenz ist wiederum vorzugsweise aus mindestens vier der vorstehend beschriebenen Module aufgebaut. 
[0018] Der Aufbau der erfindungsgemaBen DNA-Sequenz wird im folgenden beispielhaft dargesteilt. Zunachst wer- 
den die in Abb. 1 angegebenen Oligonukleotide bereitgestellt, die fur Aminosauresequenzen kodieren, die Spidroin-ty- 
pischen kurzen Aminosaure-Repeats entsprechen. Diese Oligonukleotide werden durch gentechnische Verfahren mitein- 40 
ander kombiniert, wobei sich die Kombination an der naturlichen Spidroin-Sequenz richtet (siehe Abb. 2). Die so ent- 
standenen Module A, B, C, D, E und F werden erneut miteinander kombiniert (siehe Abb. 3). Auf diese Weise werden 
erfindungsgemaBe DNA-Sequenzen bereitgestellt, die auf Aminosaureebene eine mindestens 85%ige, vorzugsweise 
mindestens 90%ige und besonders bevorzugt mindestens 94%ige Homologie zu Spidroin-Proteinen zeigen. 
[0019] Bei einer weiteren Ausfuhrungsform umfaBt die erfindungsgemaBe DNA-Sequenz zusatzlich zu den vorste- 45 
hend beschriebenen Modulen Nukleinsauresequenzen, die fur repetitive Einheiten aus Fibroin-Proteinen, vorzugsweise 
aus dem Fibroin-Protein des Seidenspinners kodieren. 

[0020] Besonders bevorzugte erfindungsgemaBe DNA-Sequenzen weisen die Sequenzen SEQ ID No. 19 bis 29 auf. 
[0021] ErfindungsgemaB ist es ferner uberraschenderweise erstmals gelungen, synthetische Spinnenseidenproteine in 
transgenen Pflanzen zu erzeugen. Auf diese Weise konnen synthetische Spinnenseidenproteine in groBem MaBstab her- 50 
gestellt werden. Um eine stabile Expression der erfindungsgemaBen DNA-Sequenz in Pflanzen zu gewahrleisten, wird 
erfindungsgemaB ein rekombinantes Nukleinsauremolekul bereitgestellt, das die vorstehend beschriebene erfindungsge- 
maBe DNA-Sequenz sowie einen ubiquitar wirkenden Promotor, vorzugsweise den CaMV35S-Promotor umfaBt. Die 
Bereitstellung des erfindungsgemaBen rekombinanten Nukleinsauremolekiils ermoglicht die Expression und Akkumula- 
tion von synthetischen Spidroin- bzw. Fibroinsequenzen in transgenen Pflanzen. 55 
[0022] Um sichcrzustellen, daB die erfindungsgemaBe DNA-Sequenz in geeigneten Kompartimenten von transgenen 
Pflanzen exprimiert und akkumuliert wird, umfaBt das erfindungsgemaBe Nukleinsauremolekul zusatzlich zu der erfin- 
dungsgemaBen DNA-Sequenz und einem ubiquitar wirkenden Promotor vorzugsweise mindestens eine Nukleinsaurese- 
quenz, die fur ein pflanzliches Signalpeptid kodiert. 

[0023] Bei einer bevorzugten Ausfuhrungsform wird als Zielkompartiment fur die Expression bzw. Akkumulation des 60 
synthetischen Spinnenseidenproteins das endoplasmatische Retikulum (ER) ausgewahlt. Dieses Kompartiment ist fur 
die stabile Akkumulation von Fremdproteinen in Pflanzen besonders geeignet. Um den Transport in das ER zu gewahr- 
leisten, umfaBt das erfindungsgemaBe Nukleinsauremolekul bevorzugt entsprechende Signalpeptide, besonders bevor- 
zugt die LeB4Sp-Sequenz. 

[0024] Die Retention im ER, falls gewunscht, wird erfindungsgemaB dadurch gewahrleistet, daB das erfindungsge- 65 
rniiBe Nukleinsauremolekul zusatzlich eine Nukleinsauresequenz umfaBt, die fiir ein ER-Retentionspeptid kodiert. \fcr- 
zugs weise wird die Retention in ER durch die C- terminal angefugte Aminosauresequenz KDEL erreicht. 
[0025] Ferner kann es vorteilhaft sein, die erfindungsgemaBe DNA-Sequenz an der Plasmalemma, d. h. der Zellmem- 
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bran, zu plazieren. Deshalb umfaBt das erfindungsgemaBe rekombinante Nukleinsauremolekiil bei einer alternativen 
Ausfiihrungsfonn die erfindungsgemaBe DNA-Sequenz, fusionierl an den N-Tcrminus einer Transmenibrandomane. 
Vorzugsweise ist diese Transmenibrandomane die Trans membrandomane des PDGF-Rezeptors, die sogenannte HOOK- 
Sequenz (siehe Abb. 4). 

5 [0026] Bei einer besonders bevorzugten Ausfuhrungsform der vorliegenden Erfindung ist das erfindungsgemaBe Nu- 
kleinsauremolekiil mit ELFs (elastin-like polypeptides) fusioniert. ELFs sind oligomere Repeats des Pentapeptids Val- 
Pro-Gly-Xaa-Gly (wobei Xaa jede Aminosaure auBer Prolin und vorzugsweise Gly ist) und unterliegen einem reversi- 
blen inversen Temperaturubergang. Sie sind in Wasser unterhalb der inverse n Ubergangs tempera tur (Tt) sehr gut loslich, 
unterliegend jedoch einem scharfen Phaseniibergang im Bereich von 2°C bis 3°C, wenn die Temperatur uber T, erhoht 

10 wird, was zur Ausfallung und Aggregation des Polypeptids fuhrt. D. E. Meyer und A. Chilkoti, Nat. Biotech. 1999, 17, 
1112-1115, haben beschrieben, daB ELP-Fusionen mit rekombinanten Proteinen das Loslichkeitsverhalten dieser rekom- 
binanten Proteine bei verschiedenen Temperaturen und Konzentrationen gezielt verandem. Bei der vorliegenden Erfin- 
dung wird dies zur Etablierung von im nachfolgenden detailliert beschriebenen Reinigungsstrategien fur das durch die 
erfindungsgemaBe DNA-Sequenz kodierte Spinnenseidenprotein genutzt. Vorzugsweise umfassen die durch die Nukle- 

15 insauresequenz in dem erfindungsgemaBen Nukleinsauremolekiil kodierten ELFs von 10 bis 100 der vorstehend be- 
schriebenen Pentamer-Einheiten (siehe Abb. 5). 

[0027] Die Herstellung der vorstehend beschriebenen chimaren Genkonstrukte bzw. rekombinanten Nukleinsauremo- 
lekule erfolgt mittels konventioneller Klonierungstechniken (siehe beispielsweise Sambrok et al. (1989, Molecular Clo- 
ning: A Laboratory Manual, 2. Auflage, Cold Spring Harbour Laboratory Press, Cold Spring Harbour, New York)). Mit- 

20 tels dieser gangigen molekularbiologischen Tcchnikcn ist es moglich, gewiinschte Konstrukte fur die Transformation 
von Pflanzen vorzubereiten bzw. herzustellen. Die fur die gentechnische Manipulation in prokaryontischen Zellen iibli- 
cherweise eingesetzten Klonierungs-, Mutagenisierungs-, Sequenzanalyse- und Restriktionsanalyse-Methoden sowie 
weitere biochemisch-molekularbiologische Methoden sind dem Fachmann wohlbekannt. So konnen nicht nur geeignete 
chimare Genkonstrukte mit der jeweils gewiinschten Fusion von Promotor, erfindungsgemafier DNA-Sequenz, fur ein 

25 pflanzliches Signalpeptid kodierender Sequenz, fur ein ER-Retentionspeptid kodierender Sequenz, fur eine Transmeni- 
brandomane kodierender Sequenz und/oder fur Reinigungselemente bzw. Loslichkeits-verandernde Peptide kodierenden 
Sequenzen hergestellt werden. Vielmehr kann der Fachmann mittels Routinetechniken, falls erwiinscht, verschiedenar- 
tige Mutationen oder Deletionen in die jeweiligen Gene einfuhren. 

[0028] Die Erfindung betrifft weiterhin Vektoren und Mikroorganismen, die erfindungsgemaBe Nukleinsauremolekule 
30 enthalten und dcren Verwendung die Herstellung von Pflanzenzellen bzw. Pflanzen ermoglicht, die Spinnenseidenpro- 
teine produzieren. Dabei handelt es sich bei den Vektoren insbesondere um Plasmide, Cosmide, Viren, Bakteriophagen 
und andere in der Gentechnik gangige Vektoren. Bei den Mikroorganismen handelt es sich in erster Linie um Bakterien, 
Viren, Pilze, Hefen und Algen. 

[0029] Da die erfindungsgemaBen DNA-Sequenzen aufgrund ihres repetitiven Charakters kaum unikale Restriktions- 
35 ortc aufweisen, wurden die erfindungsgemaBen Vektoren bzw. die das synthetische Spinnenseidenprotein kodierenden 
Gene durch verschiedene Strategien entsprechend angepaBt (siehe Abb. 6 bis 8). Bei der Amplifizierung der erfindungs- 
gemaBen DNA-Sequenzen durch PCR werden aufgrund des extrem repetitiven Charakters der erfindungsgemaBen 
DNA-Sequenzen vorzugsweise zunachst Oligonukleotide anligiert, welche dann ais Matrizen fiir die nachfolgenden 
PCR-Reaktionen dienen (siehe Abb. 7). 
40 [0030] Des weiteren wird bei der vorliegenden Erfindung ein rekombinantes Spinnenseidenprotein bereitgestellt, das 
durch die erfindungsgemaBe DNA-Sequenz kodiert wird. Dieses erfindungsgemaBe synthetische Spinnenseidenprotein, 
vorzugsweise mit einem Molekulargewicht im Bereich von 10 bis 160 kDa, weist eine mindestens 85%ige, vorzugs- 
weise mindestens 90%ige und besonders bevorzugt mindestens 94%ige Homologie zu Spidroin- und/oder Fibroin-Pro- 
teinen auf. Durch diese hohe Homologie mit den naturlichen Faserproteinen der Spinne und des Seidenspinners wird ge- 
45 wahrleistet, daB die herausragenden mechanischen Eigenschaften der naturlichen Spinnenfaden erreicht werden, wenn 
die erfindungsgemaBen Proteine zu Faden gesponnen werden. 

[0031] Ferner weisen die erfindungsgemaBen Proteine uberraschenderweise neuartige physikochemische Eigenschaf- 
ten auf. So bleibt die Loslichkeit dieser erfindungsgemaBen synthetischen Faserproteine in waBrigen Losungen auch 
nach langerem Kochen auBerordendich gut erhalten. Gemeinsam mit der ebenfalls auftretenden Loslichkeit in organi- 
50 schen Losungen und dem Fallungsverhalten bei hohen Salzkonzentrationen konnen diese neuen Eigenschaften der erfin- 
dungsgemaBen synthetischen Spinnenseidenproteine somit fiir die Entwicklung technisch durchfuhrbarer Extraktions- 
und Reinigungsverfahren genutzt werden. Diese Eigenschaften werden noch verstarkt, wenn die erfindungsgemaBen 
synthetischen Spinnenseidenproteine gezielt in bestimmten Kompartimenten, insbesondere im ER von transgenen Pflan- 
zen akkumuliert werden. 

55 [0032] Beispiele fiir Aminos auresequenzen der erfindungsgemaBen rekombinanten synthetischen Spinnenseidenpro- 
teine weisen die Sequenzen SEQ ID No. 30 bis 40 auf. Die erfindungsgemaBen Spinnenseidenproteine konnen alternativ 
auch nach chemischen, dem Fachmann bekannten Methoden synthetisiert werden, eine rekombinante Herstellung ist je- 
doch bevorzugt. 

[0033] Ferner betrifft die Erfindung ein Verfahren zur Herstellung von Spinnenseidenprotein-produzierenden Pflanzen 
60 bzw. Pflanzenzellen, umfassend die folgenden Schritte: 

a) Herstellung eines wie vorstehend beschriebenen erfindungsgemaBen rekombinanten Nukleinsauremolekuls; 

b) Ubertragung des Nukleinsauremolekuls aus a) auf pflanzliche Zellen; und 

c) gegebenenfalls die Regeneration fertiler Pflanzen aus den transformierten Pflanzenzellen. 

65 

[0034] Des weiteren betrifft die Erfindung Pflanzenzellen, die die erfindungsgemaBen Nukleinsauremolekule bzw. den 
erfindungsgemaBen Vektor enthalten. Die Erfindung betrifft ferner Emteprodukte und Vermehrungsmaterial transgener 
Pflanzen sowie die transgenen Pflanzen selbst, die ein erfindungsgemaBes Nukleinsauremolekiil enthalten. 
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[0035] Zur Vorbereitung der Ein running fremder Gene in hohere Pflanzen bzw. deren Zellen stehen eine groBe Anzahl 
von Klonierungsvektorcn zur Verfiigung, die cin Replikationssignal fur E. coli und ein Markergen zur Selektion trans- 
formierter Bakterienzellen enthalten. Beispiele fur derartige Vektoren sind pBR322, pUC-Serien, M13mp-Serien, pA- 
CYC184 usw. Die gewunschte Sequenz kann an einer passenden Restriktionsschnittstelle in den Vektor eingefuhrt wer- 
den. Das erhaltene Plasmid wird dann fiir die Transformation von E. coli-Zellen verwendet. Transformierte E. coli-Zel- 5 
len werden in einem geeigneten Medium geziichtet und anschlieBend geerntet und lysiert, und das Plasmid wird wieder- 
gewonnen. Als Analysenmethode zur Charakterisierung der gewonnenenPlasmid-DNA werden im allgemeinen Restrik- 
tionsanalysen, Gelelektrophoresen und weitere biochemisch-molekularbiologische Methoden eingesetzt. Nach jeder 
Manipulation kann die Plasmid-DNA gespalten und gewonnene DNA-Fragmente mit anderen DNA-Sequenzen ver- 
kntipft werden. 10 
[0036] Fiir die Einfuhmng von DNA in eine pflanzliche Wirtszelle stehen eine Vielzahl von Techniken zur Verfiigung, 
wobei der Fachrnann die jeweils geeignete Methode ohne Schwierigkeiten ermitteln kann. Diese Techniken umfassen die 
Transformation pflanzlicher Zellen mit T-DNA unter Verwendung von Agrobacterium tumefaciens oder Agrobacterium 
rhizogenes als Transforrnationsmedium, die Fusion von Protoplasten, die Tnjektion, die Elektroporation, den direkten 
Gentransfer isolierter DNA in Protoplasten, die Einbringung von DNA mittels der biolistischen Methode sowie weitere 15 
Moglichkeiten die bereits seit mehreren Jahren gut etabliert sind und zum ub lichen Repertoire des Fachmanns in der 
pflanzlichen Molekularbiologie bzw. Pflanzenbiotechnologie gehoren. 

[0037] Bei der Injektion und Elektroporation von DNA in Pflanzenzellen werden per se keine speziellen Anforderun- 
gen an die verwendeten Plasmide gestellt. Ahnliches gilt fur den direkten Gentransfer, Es konnen einfache Plasmide, wie 
z. B. pUG-Derivate, verwendet werden. Sollen abcr aus derartig U*ansformierten Zellen ganze Pflanzen regeneriert wcr- 20 
den, ist die Anwesenheit eines selektierbaren Markergens empfehlenswert. Dem Fachrnann sind die gangigen Selekti- 
onsmarker bekannt, und es stellt fur ihn kein Problem dar, einen geeigneten Marker auszuwahlen. 
[0038] Je nach Einfuhrungsmethode gewiinschter Gene in die Pflanzenzelle konnen weitere DNA-Sequenzen erforder- 
lich sein. Werden z. B. fur die Transformation der Pflanzenzelle das Ti- oder Ri-Plasmid verwendet, so muss mindestens 
die rechte Begrenzung, haufig jedoch die rechte und linke Begrenzung der im Ti- bzw. Ri-Plasmid enthaltenen T-DNA 25 
als Flankenbereich mit den einzufuhrenden Genen verbunden werden. Werden fiir die Transformation Agrobakterien 
verwendet, muss die einzufuhrende DNA in spezielle Plasmide kloniert werden, und zwar entweder in einen intermedia- 
ren oder in einen binaren Vektor. Die intermediaren Vektoren konnen aufgrund von Sequenzen, die homolog zu Sequen- 
zen in der T-DNA sind, durch homologe Rekombination in das Ti- oder Ri-Plasmid der Agrobakterien integriert werden. 
Dieses enthalt auBcrdem die fur den Transfer der T-DNA notwendige vir-Region. Intermediare Vektoren konnen nicht in 30 
Agrobakterien replizieren. Mittels eines Helferplasmids kann der intermediare Vektor auf Agrobacterium tumefaciens 
ubertragen werden (Konjugation). Binare Vektoren konnen sowohl in E. coli als auch in Agrobakterien replizieren. Sie 
enthalten ein Selektionsmarkergen und einen Linker oder Poly linker, welche von der rechten und linken T-DNA-Grenz- 
region eingerahmt werden. Sie konnen direkt in die Agrobakterien transformiert werden. Das als Wirtszelle dienende 
Agrobakterium soil cin Plasmid, das eine vir-Region tragt, enthalten. Die vir-Region ist fiir den Transfer der T-DNA in 35 
die Pflanzenzelle notwendig. Zusatzliche T-DNA kann vorhanden sein. Das derartig transformierte Agrobakterium wird 
zur Transformation von Pflanzenzellen verwendet. Die Verwendung von T-DNA fur die Transformation von Pflanzen- 
zellen ist intensiv untersucht und ausreichend in allseits bekannten Ubersichtsartikeln und Handbuchern zur Pflanzen- 
transformation beschrieben worden. Fiir den Transfer der DNA in die Pflanzenzelle konnen Pflanzen-Explantate zweck- 
maBigerwcise mit Agrobacterium tumefaciens oder Agrobacterium rhizogenes kultiviert werden. Aus dem infizierten 40 
Pfianzenmaterial (z. B. Blattstiicke, Stengelsegmente, Wurzeln, aber auch Protoplasten oder Suspensions-kuluvierte 
Pflanzenzellen) konnen dann in einem geeigneten Medium, welches Antibiotika oder Biozide zur Selektion transformier- 
ter Zellen enthalten kann, wieder ganze Pflanzen regeneriert werden. 

[0039] Ist die eingefuhrte DNA einmal im Genom der Pflanzenzelle integriert, so ist sie dort in der Regel stabil und 
bleibt auch in den Nachkommen der urspriinglich transformierten Zelle erhalten. Sie enthalt normalerweise einen Selek- 45 
tionsmarker, der den transformierten Pflanzenzellen Resistenz gegenuber einem Biozid oder einem Antibiotikum wie 
Kanamycin, G 418, Bleomycin, Hygromycin, Methotrexat, Glyphosat, Streptomycin, Sulfonylharnstoff, Gentamycin 
oder Phosphinotricin u. a. vermittelt. Der individuell gewahlte Marker sollte daher die Selektion transformierter Zellen 
gegenuber Zellen, denen die eingefuhrte DNA fehlt, gestatten. Hierzu sind auch alternative Marker geeignet, wie nutre- 
tive Marker, Screeningmarker (wie GFP, green fluorescent protein). Selbstverstandlich kann auch vollkommen auf Se- 50 
lektionsmarker verzichtet werden, was allerdings mit einem ziemlich hohen Screeningbedarf einhergeht. Falls marker- 
freie transgenen Pflanzen erwiinscht sind, stehen dem Fachrnann auch Strategien zur Verfiigung, die eine nachtragliche 
Entfernung des Markergens erlauben, z. B. Cotransformation, Sequenz- spezifische Rekombinasen. 
[0040] Die Regeneration der transgenen Pflanzen aus transgenen Pflanzenzellen erfolgt nach ublichen Regenerations- 
methoden unter Verwendung bekannter Nahrmedien. Die so erhaltenen Pflanzen konnen dann mittels iiblicher Verfahren, 55 
einschlicBlich molckularbiologischer Methoden, wie PGR, Blot-Analysen, auf Anwesenheit der cingefuhrtcn Nuklein- 
saure, die ein synthetisches Spinnenseidenprotein kodiert, untersucht werden. 

[0041] Bei der transgenen Pflanze bzw. der transgenen Pflanzenzelle kann es sich urn jede beliebige monokotyle oder 
dikotyle Pflanze bzw. Pflanzenzelle handeln. Vorzugsweise handelt es sich um Nutzpflanzen bzw. Zellen von Nutzpfian- 
zen. Besonders bevorzugt handelt es sich um transgene Pflanzen ausgewahlt aus der Gruppe, bestehend aus der Tabak- 60 
pflanze (Nicotiana tabacum) und der KartofFelpflanze (Solanum tuberosum). 

[0042] Die Expression des erfindungsgemaBen synthetischen Spinnenseidenproteins in den erfindungsgemaBen Pflan- 
zen bzw. in den erfindungsgemaBen Pflanzenzellen kann mit Hilfe herkommlicher molekularbiologischer und biochemi- 
scher Methoden nachgewiesen und verfolgt werden. Dem Fachrnann sind diese Techniken bekannt und er ist problemlos 
in der Lage, eine geeignete Nachweismethode zu wahlen, beispielsweise eine Northern-Blot- Analyse oder eine Sout- 65 
hern-Blot-Analyse. 

[0043] Ein Beispiel fiir die Herstellung von transgenen Spinnenseidenprotein-produzierenden Pflanzen ist in Abb. 9 
angegeben. Die durch PGR amplifizierten Sequenzen konnen moglicherweise frameshift-Mutationen enthalten. Deshalb 



5 



DE 101 13 781 A 1 



miissen die erfindungsgemaBen Sequenzen vor der Erzeugung transgener Pflanzen uberpruft werden. Dies kann durch 
Sequenzanalyse jewcils von den flankicrendcn Vektorsequenzen aus erfolgen. Langcrc Konstrukte iiber 1 kB konnen auf 
diese Weise nicht gepriift werden, da aufgrund der repetitiven Eigenschaften der erfindungsgemaBen DNA-Sequenzen 
interne Sequenzierungsprimer keine auswertbaren sicheren Sequenzen liefern. Aus diesem Grund wurden amplifizierle 
5 Spidroinsequenzen vorzugsweise in den bakteriellen Expressions vek tor pet23a (Novagen, Madison, USA) kloniert. 
Durch immunchemischen Nachweis der Expression konnen dann frames hift-Mutationen ausgeschlossen werden. 
[0044] Die erfindungsgemaBen Nukleinsauremolekiile bzw. Expressions kassetten werden erfindungsgemaB iiblicher- 
weise als HindEI-Fragmente in Shuttle- Vektoren wie pBIN, pCB301 und/oder pGSGLUCl kloniert. Diese Shutde-Vek- 
toren werden vorzugsweise in Agrobacterium tumefaciens transformiert. Die Transformation von Agrobacterium tume- 
10 faciens wird ublichcrwcisc durch Southcm-Blot-Analyse und/oder PCR-Scrcening uberpruft. 

[0045] Die Erfindung betrifTt ebenfalls Vermehrungsmaterial und Emteprodukte der erfindungsgemaBen Pflanzen, bei- 
spielsweise Fruchte, Samen, Knollen, Wurzelstocke, Samlinge, Stecklinge usw. 

[0046] Femer betrifTt die Erfindung ein Verfahren zur Gewinnung von pflanzlichem Spinnenseidenprotein, umfassend 
die folgenden Schritte: 

15 

a) die Obertragung eines erfindungsgemaBen rekombinanten Nukleinsauremolekiils oder Vektors, der eine DNA- 
Sequenz erhalt, die fur ein synthetisches Spinnenseidenprotein kodiert, auf Pflanzenzellen; 

b) gegebenenfalls die Regeneration von Pflanzen aus den transformierten Pflanzenzellen; 

c) die Verarbeitung der Pflanzenzellen aus a) bzw. der Pflanzen aus b) zur Gewinnung von pflanzlichem Spinnen- 
20 seidenprotein. 

[0047] Bei einem weiteren wesentlichen Aspekt der vorliegenden Erfindung werden Verfahren zur Gewinnung von re- 
kombinant hergestellten Spinnenseidenproteinen bereitgestellt, die die Ubertragung eines erfindungsgemaBen rekombi- 
nanten Nukleinsauremolekuls oder Vektors, der eine DNA-Sequenz enthalt, die fur ein synthetisches Spinnenseidenpro- 
25 tein kodiert, auf beliebige Zellen, d. h. neben Pflanzenzellen beispielsweise auch bakterielle oder tierische Zellen, urn- 
fassen. Wesentliches Merkmal bei diesen erfindungsgemaBen Verfahren ist dabei der Schritt der Reinigung der rekombi- 
nant hergestellten Spinnenseidenproteine, bei dem u. a. deren besondere Eigenschaften hinsichtlich der Loslichkeit bei 
Erwarmung und/oder Saurezugabe ausgenutzt werden. 

[0048] So erfolgt bei einer Ausfuhrungsform des erfindungsgemaBen Verfahrens die Reinigung des rekombinant her- 

30 gestellten Spinnenseidenproteins durch Hitzebehandlung des Zellextrakts, z. B. eines Pftanzensamen-Extrakts, und an- 
schlieBende Abtrennung der denaturierten zelleigenen, z. B. der pflanzeneigenen Proteine beispielsweise durch Zentrifu- 
gation. Dabei wird die Eigenschaft der rekombinant hergestellten Spinnenseidenproteine ausgenutzt, daB sie beim Erhit- 
zen von waBrigen Losungen bis zum Siedepunkt loslich bleiben. Dagegen bleiben beispielsweise synthetische Faserpro- 
teine der Spinne und des Seidenspinners nach Expression in Pichia pastoris beim Erhitzen nur bis zu einer Temperatur 

35 von 63°C und dann nur fur 10 Minuten in Losung. 

[0049] Bei einer weiteren Ausfuhrungsform des erfindungsgemaBen Verfahrens zur Gewinnung von rekombinant her- 
gestellten Spinnenseidenproteinen erfolgt die Reinigung durch Einstellung eines sauren pH mittels Zugabe von Saure, 
vorzugsweise Salzsaure zu dem Zellextrakt, beispielsweise zu dem Pflanzenextrakt. Der saure pH, insbesondere ein pH 
im Bereich von 1,0 bis 4,0, besonders bevorzugt im Bereich von 2,5 bis 3,5, am meisten bevorzugt ein pH von 3,0, wird 

40 dabei vorzugsweise fur eine Dauer von mehreren Minuten, besonders bevorzugt etwa 30 Minuten, bei einer Temperatur 
unterhalb Raum temperatur, vorzugsweise etwa 4°C, beibehalten. Wiederum wird eine nicht zu erwartende Eigenschaft 
der durch das erfindungsgemaBe Verfahren gewonnenen Proteine ausgenutzt, namlich daB sie beim Ansauern, insbeson- 
dere bis zu einem pH von 3,0 bei 4°C in Losung bleiben. Die zelleigenen, beispielsweise pflanzeneigenen Proteine fallen 
dagegen aus und werden insbesondere durch Zentrifugation abgetrennt. 

45 [0050] Die vorstehend beschriebenen Loslichkeitseigenschaften der nach dem erfindungsgemaBen Verfahren rekombi- 
nant hergestellten Spinnenseidenproteine sind sehr uberraschend und waren in dieser Form nicht vorhersehbar und er- 
moglichen eine effiziente, schnelle und kostengunstige Reinigung bei deren Extraktion aus Zellen, insbesondere Pflan- 
zenzellen. 

[0051] Bei einer weiteren Ausfuhrungsform des erfindungsgemaBen Verfahrens wird ein Nukleinsauremolekul auf die 
50 Zellen ubertragen, das zusatzlich eine Nukleinsauresequenz umfaBt, die fur ELFs kodiert. In diesem Fall erfolgt die Rei- 
nigung des rekombinant hergestellten Spinnenseidenproteins auf die folgende Weise: In einem ersten Schritt wird das 
Spinnenseiden-ELP-Fusionsprotein durch Hitzebehandlung des Rohextrakts angereichert. Uberraschenderweise behal- 
ten die Fusionsproteine dabei die auBerordentliche Loslichkeit der Spinnenseidenproteine bei hohen Temperaturen bei. 
Ein GroBteil der zelleigenen Proteine fallt bei dieser Temperaturerhohung aus. Im nachsten Schritt werden die Spinnen- 
55 seiden-ELP-Fusionsproteine durch weitere Temperaturerhohung, vorzugsweise auf eine Temperatur von mindestens 
60°C, ausgefallt. Vorzugsweise erfolgt die Ausfallung bei einer geeigneten Salz-Konzentration, beispielsweise einer 
NaCl-Konzentration von mindestens 0,5 M, vorzugsweise im Bereich von 1 M bis 2 M. SchlieBlich wird das ELP-Frag- 
ment, vorzugsweise durch Verdauung mit CNBr, abgespalten. 

[0052] Durch das vorstehend beschriebene erfindungsgemaBe Verfahren zur Gewinnung von rekombinant hergestell- 
60 tern Spinnenseidenprotein konnen die Proteine in Pflanzen zu hohen Konzentrationen, vorzugsweise bis zu einer Expres- 
sionshohe von etwa 4% des gesamten loslichen Proteins angereichert werden. Damit werden erstmals Verfahren bereit- 
gestellt, die zur technisch realisierbaren Anreicherung von rekombinantem Spinnenseidenprotein verwendet werden 
konnen. 

[0053] Die erfindungsgemaBen Spinnenseidenproteine konnen bei einem weiteren Aspekt der vorliegenden Erfindung 
65 zur Herstellung von synthetischen Faden sowie von Folien und Membrane n verwendet werden. Insbesondere sind der- 
artige Produkte fur medizinische Anwendungen, insbesondere zurn Vernahen von Wunden und/oder als Geruste bzw. als 
Abdeckung fur kiinstliche Organe, geeignet. Ferner konnen die aus den erfindungsgemaBen Spinnenseidenproteine her- 
gestellten Folien und Membrane u. a. als Anheftungsflachen fiir kultivierte Zellen sowie zur Filterung verwendet wer- 
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den. 

[0054] Die vorliegcnde Erfindung wird in den nachfolgcndcn Beispielcn, die dcr Veranschaulichung dcr Erfindung die- 
nen und in keiner Weise als einschrankend zu verstehen sind, erlautert. 

Beispiele 

Beispiel 1 

[0055] Expression und stabile Akkumulation von synthetischen Faserproteinen der Spinne und des Seidenspinners im 
endoplasmatischcn Reukulum von Blaltern bzw. Knollen transgener Tabak- und Kartoffelpflanzen. 
[0056] In den Abb. 10a und b sind Aminosauresequenzen von synthetischen Spinnenseidenproteinen mit einer hohen 
Homologie zu dem Spidroin 1 -Protein aus Nephila clavipes dargestellt, wobei der C-terminale und nicht repetitive kon- 
slante Bereich nicht abgebildet sind. Diese synthetischen Spinnenseidenproteine bestehen aus Modulen, die wiederum 
aneinandergereihte Oligonukleotidsequenzen umfassen. Durch Kombi nation mehrerer Module wurden die verschiede- 
nen synthetischen Gene assembliert, wobei auch Mischformen mit Fibroin 1-nachempfundenen Sequenzen erzeugt wur- 
den. 

[0057] In der nachfolgenden Tabelle 1 sind verschiedene Pflanzenexpressionskassetten aufgelistet, die fur verschie- 
dene erfindungsgemaBe synthetische Faserproteine rnit den Sequenzen SEQ ID No. 30 bis 40 kodieren. 



Tabelle 1 



Pflanzenexpressions-Kassette 


Anzahl der 
Aminosauren 
(mit Leadersequenz) 


Berechnetes 
Molekulargewicht 
(mit 

Leadersequenz) , 


Homologie 










SB1 (SEQ ID No. 19) 


Nr. 1 - 149 AS 


llkDa 


Spidroin 1 


SD1 (SEQ ID No. 21) 


Nr. 2 -182 AS 


13kDa 


Spidroin 1 


SA1 (SEQ ID No. 26) 


Nr. 3 -215 AS 


16kDa 


Spidroin I 


SE1 (SEQ ID No. 20) 


Nr. 4 -275 AS 


20kDa 


Spidroin 1 


SF1 (SEQ ID No. 29) 


Nr. 5-317 AS 


24kDa 


Spidroin 1 


SM12(SEQIDNo. 28) 


Nr. 6 -410 AS 


31 kDa 


Spidroin 1 


SOI (SEQ ID No. 27) 


Nr. 7 - 676 AS 


52kDa 


Spidroin 1 


SO ISM 12 (SEQ ID No. 23) 


Nr. 8-1035 AS 


82 kDa 


Spidroin 1 


SOI SOI (SEQ ID No. 22) 


Nr. 9-1301 AS 


102 kDa 


Spidroin 1 


SOISOISOI (SEQ ID No. 24) 


Nr. 10-1926 AS 


151 kDa 


Spidroin 1 


FA2 (SEQ ID No. 25) 


Nr. 11 -264 AS 


20 kDa 


Spidroin 1 
und Fibroin 



[0058] Durch eine N- terminate Signalpeptidsequenz und eine C-terminale ER-Retentionssequenz (KDEL) wurde der 
zielgerichtete Transport und die Akkumulation der erfindungsgemaBen Sequenzen im endoplasmatischen Reukulum von 
Zellen transgener Pflanzen erreicht. Eine Nachweissequenz in Form eines c-myc-Tags am C-terminalen Ende der trans- 
genen synthetischen Faserproteine erlaubt den Nachweis der transgenen Produkte in Pflanzenextrakten. 
[0059] Die Kassetten SOI und FA2 sind beispielhaft in den Abb. 10a und 10b im Detail dargestellt. Nach demselben 
Aufbauprinzip wurden die Pflanzenexpressionskassetten SB1, SD1, SA1, SE1, SF1, SMI 2, SOI SMI 2, SOI SOI und 
SOISOISOI erstellt. Durch Variation der Grundmodulwiederholungen entstehen synthetische Faserproteine verschie- 
dener Aminosaureanzahl und entsprechend unterschiedlichen Molekulargewichts (siehe Tabelle 1). 
[0060] Die Abb. 2 beschreibt schematise h den Weg zur Einstellung der oben genannten Konstrukte. Zur direkten Klo- 
nierung der erfindungsgemaBen synthetischen Faserproteingene wurden die Schnittstellen Smal und Nael eingefiihrt. 
Dazu wurde ein PCR-Produkt, welches die entsprechenden Schnittstellen enthielt, mit der Primerkombination 5- 
pRTRA-Smal und 3'-pRTRA-NotI in das Plasmid pRTRA ScFv SmalA/BamHIA iiber BamHI und NotI kloniert. Synthe- 
tische Faserproteingene wurden aus den Faserproteingenderivaten der Plasmide 9905 oder 9609 in den Vektor 
pRTRA.7/3-Platzhalter kloniert. Durch die Wahl der Restriktionsendonukleaseerkennungssequenzen am 5 - und 3-Ende 
der synthetischen Faserproteingene (Smal und Nael) sind diese frei miteinander kombinierbar, und groBere Faserprotein- 
gene konnen erfindungsgemaB in einem Klonierungsschritt assembliert werden. 
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[0061] Auf diese Weise wurden transgene synthetische Spinnenseidenproteine zu hohen Konzentrationen im endoplas- 
matischen Rclikulum Iransgener Tabak- und Kartoffelpflanzen akkurnulicrt (siehe Abb. 12a und 12b). In der folgenden 
Tabelle 2 ist die maximale Akkumulationshohe von erfindungsgemaBen synthetischen Spinnenseidenproteinen im ER 
von Blattern transgener Tabak- und Kartoffelpflanzen dargestellt. Die Abschatzung der Anreicherung der transgenen 
5 synthetischen Faserproteine erfolgte uber einen Vergieich niit transgenen rekombinanten Antikorpem, die auf identische 
Weise mit dem gleichen Tag versehen wurden. Damit wird erstmals eine Akkumulation von Spinnenseidenproteinen in 
Pflanzen am Beispiel von Kartoffeln und Tabak beschrieben. 

Tabelle 2 





Faserprotein 








SD1 


SM12 


SOI 


FA2 


is Tabak 

Akkumulationsmenge in 
Prozent Gesamtprotein 


~ 0,5 % 


~ 0,5 % 


~ 0,5 % 


~ 0,5 % 


Kartoffel 
20 Akkumulationsmenge in 
Prozent Gesamtprotein 


~ 0,5 % 


~ 0,5 % 


~ 0,5 % 


~ 0,5 % 



[0062] Eine definierte Menge des faserproteinhaltigen Gesamtproteinextrakts (40 ug) und eine definierte Menge eines 
25 Referenzproteins mit c-myc-Immunotag (50 ng ScFv) wurden mittels SDS-Gelelektrophorese aufgetrennt, und syntheti- 
sche Faserproteine und Referenzproteine wurden im Western Blot durch einen Antic-myc-Antikorper nachgewiesen 
(siehe Abb. 12 und 13). Die prozentualen Angaben resultieren aus dem Vergieich zwischen der Bandenintensitat der Re- 
ferenzproteine und der Bandenintensitat der synthetischen erfindungsgemaBen Spinnenseidenproteine und stellen ge- 
schatzte Werte dar. GroBenunterschiede der synthetischen Faserproteine und des Referenzproteins wurden beriicksich- 
30 tigt. Mogliche Unterschiede in der Markierungseffizienz konnen nahezu ausgeschlossen werden. 

[0063] In Abb. 13 ist die Hitzestabilitat von verschiedenen erfindungsgemaBen synthetischen Spinnenseidenproteinen 
in pflanzlichen Extrakten dargestellt. Uberraschenderweise bleiben die erfindungsgemaBen Spinnenseidenproteine auch 
bei einer langeren Hitzebehandlung von 3 h in Losung (Vergieich der Referenzprobe R zu den Proben H-60 min. H- 
120 min und H-180 min). Die ubrigen pflanzlichen Proteine werden zu mehr als 90% denaturiert und konnen durch Zen- 
35 trifugation einfach abgetrennt werden (Abb. 13a: Vergieich der Probe R zu H-60 min). Diese ungewohnlichcn Eigen- 
schaften der erfindungsgemaBen synthetischen Spinnenseidenproteine, die unter anderem durch ihre Aminos aurese- 
quenz und ihreFaltung im pflanzlichen ER bedingt sind, ermoglichen die Entwicklung von groBtechnisch realisierbaren 
und kostengiinstigen Reinigungsstrategien. 

[0064] In Abb. 14 wird die Losiichkeit von synthetischen Faserproteinen aus transgenen Pflanzen dargestellt. Im Ge- 
40 gensatz zu den im Stand der Technik beschriebenen bakteriell exprimierten synthetischen Faserproteinen weisen die er- 
findungsgemaBen Spinnenseidenproteine eine iiberraschend gute Losiichkeit in waBrigen PufTern auf (Rl, R2 = Tris- 
Puffer; Tl , T2 = Phosphatpuffer). Auch diese Eigenschaften beruhen unter anderem auf der Aminosauresequenz und ins- 
besondere auf der Faltung im endoplasmatischen Retikulum pflanzlicher Zellen. 

45 Beispiel 2 

[0065] Expression und stabile Akkumulation von synthetischen Spinnenseidenproteinen im Plasmalemma von Blat- 
tern transgener Tabak- und KartofTelpflanzen. 

[0066] In diesem Beispiel wird die membranassoziierte Akkumulation von erfindungsgemaBen Spinnenseidenprotei- 
50 nen in transgenen Tabak- und Kartoffelpflanzen beschrieben. Dabei wurden ausgehend von den in Beispiel 1 beschrie- 
benen Konstrukten Fusionsgene hergestellt, die fur ein Spinnenseidenprotein und fur eine Membrandomane kodieren. 
Das allgemeine Schema dieser Konstruktionen ist in Abb. 15 dargestellt. Dabei wurde aus dem Plasmid pRT-HOOK ein 
Notl-Fragment isoliert, welches sowohl fiir die HOOK-Domane als auch flir einen c-myc-Immunotag kodiert, welches 
dann in Spinnenseidenproteingen-tragende Derivate des Vektors pRTA.7/3 kloniert wurde. Durch die Wahl der Restrik- 
55 tionsendonukleaseerkennungssequenzen am 5'- und 3'-Ende der synthetischen Spinnenseidenproteingene (Smal und 
Nael) sind diese wiederum miteinander kombinierbar, wodurch groBere Faserproteingene in einem Klonierungsschritt 
assimiliert werden konnen. 

[0067] Abb. 1 6 zeigt die Expression der vorstehend beschriebenen Gene in transgenen Tabak- und KartofTelpflanzen. 
Wie aus dem Vergieich der Proben 1, 2 und 3 in dieser Abbildung ersichtlich ist, sind diese transgenen Spinnenseiden- 
60 proteine im Gegensatz zu den im Beispiel 1 beschriebenen erfindungsgemaBen Proteinen in der waBrigen Phase nicht 
loslich. Auch diese Eigenschaft kann fiir die Entwicklung von Reinigungsstrategien ausgenutzt werden. 

Beispiel 3 

65 [0068] Gezielte Veranderung der Losiichkeit von Spinnenseidenproteinen durch Fusion mit elastin-like peptides. 

[0069] In einem ersten Schritl wurde gezeigt, daB Fusionen mit elastin-like peptides auch bei bakteriell exprimierten 
Spinnenseidenproteinen zu einer gezielten Veranderung des Loslichkeitsverhaltens in Abhangigkeit von Temperatur und 
Konzentration fuhren. 
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[0070] Eine entsprechende Expressionskassette ist in Abb. 5 dargestellt. Beispiele fur ELP mit 10, 20, 30, 40, 60, 70 
und 100 Pcntamercinheitcn sind in den Scqucnzen SEQ ID No. 41 bis 47 angegeben. Bcispielc fur DNA-Sequenzen und 
Aminosauresequenzen in Form des Konstrukts SM12-70xELP als Pflanzenexpressionskassette bzw. als Expressionskas- 
sette fur E. coli sind in den Sequenzen SEQ ID No. 48-51 bzw. in den Abb. 19 bis 22 angegeben. 

[0071] In Abb. 17 wird die gelelektrophoretische Analyse eines solchen Reinigungsverfahrens dargestellt. Durch Hit- 5 
zebehandlung des Rohextrakts wurde das Spinnenseiden-ELP-Fusionsprotein angereichert. Uberraschenderweise be- 
hielten die Fusionsproteine die auBerordentliche Loslichkeit der Spinnenseidenproteine bei hohen Temperaturen bei. Ein 
GroBteil der E. coli-Proteine wurde bei diesen Temperaturen ausgefallt. 

[0072] Nach starker Konzentration des angereicherten Spinnenseidenproteinextrakts wurde das Extrakt einer Tempe- 

ratur von 60°C ausgesetzt, woraufhin das ELP-Spinnenseidenprotcin ausfiel und pelletiert wurde. Das Pellet wurde bei 10 

Raumtemperatur in Wasser gelost, und unlosliche Bestandteile wurden durch Pelletieren entfernt. 

[0073] AnschlieBend wurde die Spinnenseidenproteinfraktion lyophilisiert und durch Cyanbromidspaltung verdaut. 

Die Cyanbromidspaltung wurde durch den Methionin-Rest zwischen dem Spinnenseidenprotein und dem ELP-Peptid er- 

moglicht. 

[0074] AnschlieBend wurde erneut lyophilisiert und in waBrigem Puffer gelost. Dann erfolgte eine starke Konzentra- 15 
tion, wobei das abgespaltene ELP-Fragment (ELP(T-R); siehe Abb. 2) ausfiel und durch Pelletieren entfernt wurde. Das 
Spinnenseidenprotein blieb dabei in Losung (SM12(T-R); siehe Abb. 17). Die Loslichkeit blieb fur einen langeren Zeit- 
raum erhalten, bei SMI 2 bei 4°C fur 24 H. Die Identitat des auf diese Weise gereinigten Spinnenseidenproteins wurde 
durch Peptidsequenzierung des N-terminalen Endes gezeigt. 

[0075] In einem zweiten Schritt wurden Spinnenseidenproteine als ELP-Fusionen im endoplasmalischen Retikulum 20 
von transgenen Tabakpflanzen akkumuliert. Der prinzipielle Aufbau dieser Expressionskassetten ist ebenfalls in Abb. 5 
dargestellt. Diese Fusionsproteine mit Molekulargewichten von 35.000 Dalton bis 100.000 Dalton wurden samtlich in 
Pflanzen zu hohen Konzentrationen mit einer Expressionshohe von etwa 4% des gesamt loslichen Proteins angereichert. 

Abbildungen 25 

Abb. 1 

[0076] Oligonukleotid-Sequenzen, die fur Spidroin-typische kurze Aminosaurerepeats kodieren. 

30 

Abb. 2 

[0077] Aneinanderreihung von Oligonukleotid-Sequenzen zum Aufbau von Modulen der erfindungsgemafien DNA- 
Sequenzen. 

35 

Abb. 3 

[0078] Aufbau der erfindungsgemaBen DNA-Sequenzen aus Modulen. 

Abb. 4 40 

[0079] Klonierung des Gens der Transmembrandomane von HOOK mit NotI aus (pRT-HOOK) in (pRTA.73 syn.spi- 
droin). 

Abb. 5 45 

[0080] Schematische Darstellung der Spidroin-ELP-Expressionskassetten. xELP-Einheiten: 10, 20, 30, 40; 60, 70 oder 
100 Pentamere (Val-Pro-Gly-Val-Gly). Das Methionin zwischen dem Spinnenseidenprotein und dem ELP-Pcptid ermog- 
licht die Cyanbromidspaltung. 

50 

Abb. 6 

[0081] Veranderung einer Base in der Erkennungssequenz von BamHI (Position 1332) durch gezielte Mutagenese. 

Abb. 7 55 

[0082] Vorbereiten von (pRTRA.73, BamHIA) auf die direkte Klonierung der synthetischen Spidroingene aus p9905 
oder p9609 - Aufheben der Smal- Erkennungssequenz (Position 463). 

Abb. 8 60 

[0083] Einfuhrung der Restriktionserkennungssequenzen von Smal und Nael in den Vektor (pRTRA.73, Bam- 
HIA+SmalA) fiir die Klonierung synthetischer Spidroingene. 

Abb. 9 65 

[0084] Allgemeine Darstellung der Herstellung transgener Spinnseidenprotein-produzierender Pflanzen. 
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Abb. 10 

10085] (a) Darstellung des modulhaften Aufbaus der erfindungsgemaBen Spinnenseidenproteine am Bei spiel der SOI- 
Sequenz. Aminosauren 1-28: LeB4-Signalpeptid; Aminosauren 29-659: synthetische Spinnenseidenproteinsequenz; 
5 Aminosauren 660-672: c-myc-Tag; Aminosauren 673-676 ER-Retentionssignal. 

[0086] Anordnung der Sequenzmodule nach der in Simmons et al., 1996. Molecular orientation and two-component 
nature of the cristalline fraction of spider dragline silk. Science 271: 84-87 angegebenen Originalsequenz. 
[0087] (b) Darstellung des modulhaften Aufbaus des synthetischen Faserhybridproteins FA2. Aminosauren 1-28: 
LeB4-Signalpeptid; Aminosauren 28-130: syntheusche Faserproteinsequenz der Spinne; Aminosauren 131-247: syn- 
10 thetische Faserproteinsequenz des Scidenspinncrs; Aminosauren 248-260: c-myc-Tag; Aminosauren 261-264: ER-Re- 
tentionssignal. 

Abb. 11 

15 [0088] Schematische Darstellung der Erstellung von Genkassetten fur die Akkumuiation von synthetischen Faserpro- 
teinen der Spinne und des Seidenspinners im ER von Iransgenen Pflanzen. 

Abb. 12 

20 [0089] (a) Expression der synthetischen Faserproteine der Spinne (SD1 , SMI 2, SOI) bzw. des Hybrids aus Spinne und 
Seidenspinner (FA2) in Blattern von transgenen Tabakpflanzen. Analysiert wurden jeweils 40 ug Gesamtprotein in SDS- 
Probenpuffer. SD1: 13 kDa; FA2: 20 kDa; SMI 2: 31 kDa; SOI: 52 kDa; K: Positivkontrolle 50 ng ScFv. 
[0090] (b) Expression der synthetischen Faserproteine der Spinne (SD1 , SM12, SOI) bzw. des Hybrids aus Spinne und 
Seidenspinner (FA2) in transgenen Kartoffelpflanzen. 

25 [0091] Analysiert wurden ebenfalls jeweils 40 ug Gesamtprotein in SDS-Probenpuffer. SD1: 13 kDa; FA2: 20 kDa; 
SM12: 31 kDa; SOI: 52 kDa; K: Positivkontrolle 50 ng ScFv. 

Abb. 13 

30 [0092] Darstellung der Hitzebestandigkeit der synthetischen Faserproteine der Spinne und des Seidenspinners anhand 
der Konstrukte SD1 und FA2. A: Coomassie-gefarbtes Gel. B: Immunochernischer Nachweis der synthetischen Faser- 
proteine SD1 und FA2 mittels Anti-c-myc-Antikorper. PM: Proteinmarker; ScFv: 50 ng ScFv; R: waBriges Pflanzenex- 
trakt von Blattern von transgenen Pflanzen fur SD1 und FA2; H: Hitzeschritt 60 min, 120 min, 180 min, 24 H und 48 H 
bei 90°C. 

35 [0093] Bei der Hitzebehandlung ausgefallene Pflanzenextraktbestandteile wurden durch Zentrifugieren abgetrennt. 

Abb. 14 

[0094] Untersuchung der Losungseigenschaften und Stabilitat des synthetischen Spinnenseidenproteins SOI nach 

40 Ammoniumsuifatfallung. 

[0095] 10 g Blattmaterial wurden in Stickstoff schockgefroren, zermorsert, in 20 ml Rohextraktpuffer aufgenommen, 
fur 30 min bei 38°C geschiittelt, und unlosliche Bestandteile wurden durch Zentrifugieren entfernt (30 min. 10.000 rpm). 
AnschlieBend wurde der Uberstand (R) fur 10 min auf 90°C erhitzt und das Prazipitat durch Zentrifugieren entfernt 
(30 min. 10.000 rpm). Der Uberstand (H) wurde mit 20% Ammoniumsulfat versetzt, 4 h bei Raumtemperatur gerollt und 

45 das Prazipitat durch Zentrifugieren fur 60 min bei 4000 rpm und 4°C entfernt. Der Uberstand wurde auf 30% Endkon- 
zentration Ammoniumsulfat eingestellt und uber Nacht bei Raumtemperatur gerollt. Die Losung wurde in 5 Aliquote ge- 
trennt und das Prazipitat durch Zentrifugieren entfernt (60 min. 4000 rpm, 4°C). Die Uberstande wurden verworfen und 
die verbliebenen Pellets in folgenden Losungen aufgenommen: Rl: Rohextraktpuffer (50 mM Tris/HG pH 8,0; 100 mM 
NaCl, 10 mM MgS0 4 ); S: SDS-Probenpuffer; G: 0,1 M Phosphatpuffer, 0,01 M Tris/HCl, 6 M Guanidiniumhydrochlo- 

50 rid/HCl pH 6,5; T: 1 x PBS, 1% TritonX-100; L: LiBr. 

[0096] Die Ansatze wurden fiir 1 h bei 37°C geschiittelt, und durch Zentrifugieren wurden unlosliche Bestandteile ent- 
fernt (30 min. 10.000 rpm). AnschlieBend wurde ein Aliquot jedes Ansatzes entnommen und fur die SDS-Geielektropho- 
rese vorbereitet (Rl, SI, Gl, Tl, LI). Die Ansatze wurden nun 36 h bei Raumtemperatur stehen gelassen. Durch Zentri- 
fugieren wurden unlosliche Bestandteile entfernt (30 min, 10.000 rpm). Wiederum wurde ein Aliquot jedes Ansatzes 

55 entnommen und fur die SDS-Gelelektrophorese vorbereitet (R2, S2, G2, T2, L2). Es wurden jeweils vergleichbare Voiu- 
mina analysiert. 

Abb. 15 

60 [0097] Schematische Darstellung der Konstruktion von Genkassetten fiir die Akkumuiation von Plasmalemma-standi- 
gen synthetischen Faserproteinen der Spinne und des Seidenspinners in transgenen Pflanzen. 

Abb. 16 

65 [0098] Expression der Faserfusionsproteine SM12-H0OK, SOl-HOOK und FA2-HOOK in Blattern von transgenen 
Kartoffelpflanzen. 
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Abb. 17 

[0099] Gelelektrophoretische Analyse der Anreicherung von bakteriell exprimierten Spinnenseidenproteinen nach Fu- 
sion mitELFs. Spinnenseidenprotein: 30.000 Dalton. 

Abb. 18 

[0100] Western Blot- Analyse der Expression von Spinnenseiden-ELP-Fusionsproteinen in transgenen Tabakpflanzen. 
Jeweiis 2,5 jag Gesamtpflanzenprotein wurden getrennt und die Spinnenseidenproteine auf dem Western Blot durch ECL 
nachgewicscn. Durch Vergleich mil dem Standard wird die Spinncnseidenproteinkonzcntration auf mindcstens 4% des 
gesamtloslichen Proteins geschatzt. 

Abb. 19 

[0101] DNA-Sequenz von SM12-70xELP als Pflanzenexpressionskassette. 

Abb. 20 

[0102] Proteinsequenz von SM12-70xELP aus pflanzlicher Expression (SMI 2, c-myc-Tag, 70xELP, KDEL - jeweiis 
durch Absatz gekennzeichnet). 

Abb. 21 

[0103] DNA-Sequenz von SM12-70xELP als Expressionskassette fur E. coli. 

Abb. 22 

[0104] Proteinsequenz von SM12-70xELP aus bakterieller Expression (SM12, c-myc-Tag, 70xELP, c-myc-Tag, Hi- 
sTag - jeweiis durch Absatz gekennzeichnet). 
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SEQUENZPROTOKOLL 
<110> IPK - Institut fur Pf lanzengenetik und Kulturpflan 

5 <120> Synthetische Spinnenseidenproteine und deren Expression 
in transgenen Pflanzen 

l0 <130>' I 7222 

<140> 
<141> 

15 

<150> DE 100 28 212.1 
<151> 2000-06-09 

20 

<150> DE 100 53 478.3 
<151> 2000-10-24 

25 <160> 51 

<170> Patentln Ver. 2.1 

<210> 1 
<211> 22 
<212> DNA 
35 <213> Kiinstliche Sequenz 

<220> 

<223> Beschreibung der kunstlichen Sequenz : repetitive 
40 Einheit aus Spidroin-Proteinen 

<400> 1 

tatgagcgct cccgggcagg gt 22 

45 



<210> 2 
50 <211> 38 
<212> DNA 

<213> Kunstliche Sequenz 
55 <220> 

<223> Beschreibung der kunstlichen Sequenz -.repetitive 
Einheit aus Spidroin-Proteinen 

60 

<400> 2 

agcttttagg taccaatatt aatctggccg gctccacc 38 
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<210> 3 
<211> 12 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequen2 : repetitive 
Einheit aus Spidroin-Proteinen 

<400> 3 
tatggtctgg gg 

<210> 4 
<211> 18 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : repetitive 
Einheit aus Spidroin-Proteinen 

<400> 4 

ggccagggtg ctggccaa 

<210> 5 
<211> 33 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : repetitive 
Einheit aus Spidroin-Proteinen 

<400> 5 

ggtgcaggag cwgcwgcwgc wgctgcaggt gga 

<210> 6 
<211> 28 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : repetitive 
Einheit aus Spidroin-Proteinen 
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<400> 6 

gccggccaga ttaatattgg tacctaaa 

<210> 7 
<211> 17 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : repetitive 
Einheit aus Spidroin-Proteinen 

<400> 7 

ctgcccggga gcgctca 

<210> 8 
<211> 15 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : repetitive 
Einheit aus Spidroin-Proteinen 

<400> 8 

accaccataa cctcc 



<210> 9 
<211> 18 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : repetitive 
Einheit aus Spidroin-Proteinen 

<400> $ 

agcaccctgg ccccccag 

<210> 10 
<211> 33 
<212> DNA 

<213> Kunstliche Sequenz 
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<220> 

<223> Beschreibung der kunstlichen Sequenz : repetitive 
Einheit aus Spidroin-Proteinen 

<400> 10 

tgcagcwgcw gcwgcwgctc ctgcaccttg gcc 

<210> 11 
<211> 22 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : repetitive 
Einheit aus Spidroin-Proteinen 

<400> 11 

tatgagatct ggccaaggag gt 

<210> 12 
<211> 14 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : repetitive 
Einheit aus Spidroin-Proteinen 

<400> 12 
ttggccagat ctca 

<210> 13 
<211> 27 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : repetitive 
Einheit aus Spidroin-Proteinen 

<400> 13 

agtcagggtg ctggtcgtgg aggccaa 
<210> 14 
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<211> 27 

<212> DNA 

<213> Kunstliche Sequenz 

5 

<220> 

<22 3> Beschreibung der kunstlichen Sequenz : repetitive 

l0 Einheit aus Spidroin-Proteinen 

<400> 14 

tccacgacca gcaccctgac tccccag 

15 



<210> 15 
20 <211> 36 
<212> DNA 

<213> Kunstliche Sequenz 
25 <220> 

<223> Beschreibung der kiinstlichen Sequenz : repetitive 
Einheit aus Spidroin-Proteinen 

30 

<400> 15 

agtcagggcg ctggtcgtgg gggactgggt ggccaa 

35 

<210> 16 
<211> 36 
<212>.DNA 
40 <213> Kunstliche Sequenz 

<220> 

45 <223> Beschreibung der kunstlichen Sequenz : repetitive 
Einheit aus Spidroin-Proteinen 

<400> 16 

so acccagtccc ccacgaccag cgccctgact ccccag 



<210> 17 
<211> 24 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : repetitive 
Einheit aus Spidroin-Proteinen 

<400> 17 
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ctgggagggc agggagcggg ccaa 24 

<210> 18 
<211> 24 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz ■: repetitive 
Einheit aus Spidroin-Proteinen 

<400> 18 

cgctccctgc cctcccagac ctcc 24 

<210> 19 
<211> 327 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : Konstrukt SB1 
<400> 19 

ggatcccagt tagggcaggg aggttatggt ggtctggggg gccagggtgc tggccaagga 60 
ggttatggtg gtctggggag tcagggcgct ggtcgtgggg gactgggtgg ccaaggtgca 12 0 
ggagctgctg ctgcagctgc aggtggagcc gggcagggag gtctgggagg gcagggagcg 180 
ggccaaggtg caggagcagc tgcagcagct gcaggtggag ccgggcaggg aggttatggt 24 0 
ggtctgggga gtcagggtgc tggtcgtgga ggccaaggtg caggagctgc agcagcagct 300 
gcaggtggag ccggacaagc ggccgca 327 

<210> 20 
<211> 705 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : Konstrukt SE1 
<400> 20 

ggatcccagt tagggcaggg aggttatggt ggtctggggg gccagggtgc tggccaagga 60 
ggttatggtg gtctggggag tcagggcgct ggtcgtgggg gactgggtgg ccaaggtgca 120 
ggagctgctg ctgcagctgc aggtggagcc gggcagggag gtctgggagg gcagggagcg 180 
ggccaaggtg caggagcagc tgcagcagct gcaggtggag ccgggcaggg aggttatggt 240 
ggtctgggga gtcagggcgc tggtcgtggg ggactgggtg gccaaggtgc aggagcagct 300 
gcagctgctg caggtggagc cgggcaggga ggttatggtg gtctggggag tcagggtgct 360 



17 



DE 101 13 781 A 1 



ggtcgtggag gccaaggtgc aggagctgca 
ggttatggtg gtctggggag tcagggcgct 
ggagcagctg cagctgctgc aggtggagcc 
cagggtgctg gtcgtggagg ccaaggtgca 
gggcagggag gttatggtgg tctggggagt 
ggagctgcag cagcagctgc aggtggagcc 



gcagcagctg caggtggagc cgggcaggga 42 0 
ggtcgtgggg gactgggtgg ccaaggtgca 480 
gggcagggag gttatggtgg tctggggagt 540 
ggagctgcag cagcagctgc aggtggagcc 600 
cagggtgctg gtcgtggagg ccaaggtgca 660 
ggacaagcgg ccgca 705 



<210> 21 
<211> 426 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : Konstrukt SD1 
<400> 21 

ggatcccagt tagggcaggg aggttatggt ggtctggggg gccagggtgc tggccaagga 60 
ggttatggtg gtctggggag tcagggcgct ggtcgtgggg gactgggtgg ccaaggtgca 120 
ggagctgctg ctgcagctgc aggtggagcc gggcagggag gtctgggagg gcagggagcg 160 
ggccaaggtg caggagcagc tgcagcagct gcaggtggag ccgggcaggg aggttatggt 240 
ggtctgggga gtcagggtgc tggtcgtgga ggccaaggtg caggagctgc agcagcagct 300 
gcaggtggag ccgggcaggg aggttatggt ggtctgggga gtcagggcgc tggtcgtggg 360 
ggactgggtg gccaaggtgc aggagcagct gcagctgctg caggtggagc cggacaagcg 420 
gccgca 426 

<210> 22 
<211> 3763 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : Konstrukt 
S01SO1 

<400> 22 

ggatcccagt tacccgggca gggaggttat ggtggtctgg ggggccaggg tgctggccaa 60 
ggaggttatg gtggtctggg gggccagggt gctggccaag gtgcaggagc tgctgctgca 120 
gctgcaggtg gagccgggca gggaggttat ggtggtctgg ggagtcaggg tgctggtcgt 180 
ggaggccaag gtgcaggagc tgcagcagca gctgcaggtg gagccgggca gggaggttat 240 
ggtggtctgg ggagtcaggg cgctggtcgt gggggactgg gtggccaagg tgcaggagca 300 
gctgcagctg ctgcaggtgg agccgggcag ggaggttatg gtggtctggg gagtcagggt 360 
gctggtcgtg gaggccaagg tgcaggagct gcagcagcag ctgcaggtgg agccgggcag 420 
ggaggttatg gtggtctggg gagtcagggc gctggtcgtg ggggactggg tggccaaggt 4 80 
gcaggagcag ctgcagctgc tgcaggtgga gccgggcagg gaggttatgg tggtctgggg 540 
ggccagggtg ctggccaagg aggttatggt ggtctgggga gtcagggcgc tggtcgtggg 600 
ggactgggtg gccaaggtgc aggagctgct gctgcagctg caggtggagc cgggcaggga 660 
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ggtctgggag ggcagggagc gggccaaggt 
gccgggcagg gaggttatgg tggtctgggg 
gcaggagctg cagcagcagc tgcaggtgga 
ggccagggtg ctggccaagg aggttatggt 
ggactgggtg gccaaggtgc aggagctgct 
ggtctgggag ggcagggagc gggccaaggt 
gccgggcagg gaggttatgg tggtctgggg 
ggccaaggtg caggagcagc tgcagctgct 
ggtctgggga gtcagggtgc tggtcgtgga 
gcaggtggag ccgggcaggg aggttatggt 
ggactgggtg gccaaggtgc aggagcagct 
ggttatggtg* gtctggggag tcagggtgct 
gcagcagctg caggtggagc cgggcaggga 
ggtcgtggag gccaaggtgc aggagctgca 
ggttatggtg gtctgggggg ccagggtgct 
cagggcgctg gtcgtggggg actgggtggc 
ggtggagccg ggcagggagg tctgggaggg 
gcagcagctg caggtggagc cgggcaggga 
ggtcgtggag gccaaggtgc aggagctgca 
ggttatggtg gtctggggag tcagggcgct 
ggagcagctg cagctgctgc aggtggagcc 
cagggtgctg gccaaggagg ttatggtggt 
ggagctgctg ctgcagctgc aggtggagcc 
cagggtgctg gtcgtggagg ccaaggtgca 
gggcagggag gttatggtgg tctggggagt 
caaggtgcag gagcagctgc agctgctgca 
ctggggagtc agggtgctgg tcgtggaggc 
ggtggagccg ggcagggagg ttatggtggt 
ctgggtggcc aaggtgcagg agcagctgca 
tatggtggtc tggggggcca gggtgctggc 
ggcgctggtc gtgggggact gggtggccaa 
ggagccgggc agggaggtct gggagggcag 
gcagctgcag gtggagccgg gcagggaggt 
cgtggaggcc aaggtgcagg agctgcagca 
tatggtggtc tggggggcca gggtgctggc 
ggcgctggtc gtgggggact gggtggccaa 
ggagccgggc agggaggtct gggagggcag 
gcagctgcag gtggagccgg gcagggaggt 
cgtgggggac tgggtggcca aggtgcagga 
cagggaggtt atggtggtct ggggagtcag 
gctgcagcag cagctgcagg tggagccggg 
ggcgctggtc gtgggggact gggtggccaa 
ggagccgggc agggaggtta tggtggtctg 
ggtgcaggag ctgcagcagc agctgcaggt 
gggagtcagg gtgctggtcg tggaggccaa 
ggagccgggc agggaggtta tggtggtctg 
ggtggtctgg ggagtcaggg cgctggtcgt 
gctgctgcag ctgcaggtgg agccgggcag 



gcaggagcag 


ctgcagcagc 


tgcaggtgga 


720 


agtcagggtg 


ctggtcgtgg 


aggccaaggt 


780 


gccgggcagg 


gaggttatgg 


tggtctgggg 


840 


ggtctgggga 


gtcagggcgc 


tggtcgtggg 


900 


gctgcagctg 


caggtggagc 


cgggcaggga 


960 


gcaggagcag 


ctgcagcagc 


tgcaggtgga 


1020 


agtcagggcg 


ctggtcgtgg 


gggactgggt 


1080 


gcaggtggag 


ccgggcaggg 


aggttatggt 


1140 


ggccaaggtg 


caggagctgc 


agcagcagct 


1200 


ggtctgggga 


gtcagggcgc 


tggtcgtggg 


1260 


gcagctgctg 


caggtggagc 


cgggcaggga 


1320 


ggtcgtggag 


gccaaggtgc 


aggagctgca 


1380 


ggttatggtg 


gtctggggag 


tcagggtgct 


1440 


gcagcagctg 


caggtggagc 


cgggcaggga 


1500 


ggccaaggag 


gttatggtgg 


tctggggagt 


1560 


caaggtgcag 


gagctgctgc 


tgcagctgca 


1620 


cagggagcgg 


gccaaggtgc 


aggagcagct 


1680 


ggttatggtg 


gtctggggag 


tcagggtgct 


1740 


gcagcagctg 


caggtggagc 


cgggcaggga 


1800 


ggtcgtgggg 


gactgggtgg 


ccaaggtgca 


1860 


gggcagggag 


gttatggtgg 


tctggggggc 


1920 


ctggggggcc 


agggtgctgg 


ccaaggtgca 


1980 


gggcagggag 


gttatggtgg 


tctggggagt 


2040 


ggagctgcag 


cagcagctgc 


aggtggagcc 


2100 


cagggcgctg 


gtcgtggggg 


actgggtggc 


2160 


ggtggagccg 


ggcagggagg 


ttatggtggt 


2220 


caaggtgcag 


gagctgcagc 


agcagctgca 


2280 


ctggggagtc 


agggcgctgg 


tcgtggggga 


2340 


gctgctgcag 


gtggagccgg 


gcagggaggt 


2400 


caaggaggtt 


atggtggtct 


ggggagtcag 


2460 


ggtgcaggag 


ctgctgctgc 


agctgcaggt 


2520 


ggagcgggcc 


aaggtgcagg 


agcagctgca 


2580 


tatggtggtc 


tggggagtca 


gggtgctggt 


2640 


gcagctgcag 


gtggagccgg 


gcagggaggt 


2700 


caaggaggtt 


atggtggtct 


ggggagtcag 


2760 


ggtgcaggag 


ctgctgctgc 


agctgcaggt 


2820 


ggagcgggcc 


aaggtgcagg 


agcagctgca 


2880 


tatggtggtc 


tggggagtca 


gggcgctggt 


2940 


gcagctgcag 


ctgctgcagg 


tggagccggg 


3000 


ggtgctggtc 


gtggaggcca 


aggtgcagga 


3060 


cagggaggtt 


atggtggtct 


ggggagtcag 


3120 


ggtgcaggag 


cagctgcagc 


tgctgcaggt 


3180 


gggagtcagg 


gtgctggtcg 


tggaggccaa 


3240 


ggagccgggc 


agggaggtta 


tggtggtctg 


3300 


ggtgcaggag 


ctgcagcagc 


agctgcaggt 


3360 


gggggccagg 


gtgctggcca 


aggaggttat 


3420 


gggggactgg 


gtggccaagg 


tgcaggagct 


3480 


ggaggtctgg 


gagggcaggg 


agcgggccaa 


3540 
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ggtgcaggag cagctgcagc agctgcaggt 
gggagtcagg gtgctggtcg tggaggccaa 
ggagccgggc agggaggtta tggtggtctg 
ggtggccaag gtgcaggagc agctgcagct 
gca 



ggagccgggc agggaggtta tggtggtctg 3600 
ggtgcaggag ctgcagcagc agctgcaggt 3660 
gggagtcagg gcgctggtcg tgggggactg 3720 
gctgcaggtg gagccggcgg acaagcggcc 3780 

3783 



<210> 23 
<211> 2985 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : Konstrukt 
S01SM12 

<400> 23 

ggatcccagt tacccgggca gggaggttat ggtggtctgg ggggccaggg tgctggccaa 60 
ggaggttatg gtggtctggg gggccagggt gctggccaag gtgcaggagc tgctgctgca 120 
gctgcaggtg gagccgggca gggaggttat ggtggtctgg ggagtcaggg tgctggtcgt 180 
ggaggccaag gtgcaggagc tgcagcagca gctgcaggtg gagccgggca gggaggttat 24 0 
ggtggtctgg ggagtcaggg cgctggtcgt gggggactgg gtggccaagg tgcaggagca 300 
gctgcagctg ctgcaggtgg agccgggcag ggaggttatg gtggtctggg gagtcagggt 360 
gctggtcgtg gaggccaagg tgcaggagct gcagcagcag ctgcaggtgg agccgggcag 420 
ggaggttatg gtggtctggg gagtcagggc gctggtcgtg ggggactggg tggccaaggt 480 
gcaggagcag ctgcagctgc tgcaggtgga gccgggcagg gaggttatgg tggtctgggg 540 
ggccagggtg ctggccaagg aggttatggt ggtctgggga gtcagggcgc tggtcgtggg 600 
ggactgggtg gccaaggtgc aggagctgct gctgcagctg caggtggagc cgggcaggga 660 
ggtctgggag ggcagggagc gggccaaggt gcaggagcag ctgcagcagc tgcaggtgga 720 
gccgggcagg gaggttatgg tggtctgggg agtcagggtg ctggtcgtgg aggccaaggt 780 
gcaggagctg cagcagcagc tgcaggtgga gccgggcagg gaggttatgg tggtctgggg 84 0 
ggccagggtg ctggccaagg aggttatggt ggtctgggga gtcagggcgc tggtcgtggg 900 
ggactgggtg gccaaggtgc aggagctgct gctgcagctg caggtggagc cgggcaggga 960 
ggtctgggag ggcagggagc gggccaaggt gcaggagcag ctgcagcagc tgcaggtgga 1020 
gccgggcagg gaggttatgg tggtctgggg agtcagggcg ctggtcgtgg gggactgggt 1080 
ggccaaggtg caggagcagc tgcagctgct gcaggtggag ccgggcaggg aggttatggt 1140 
ggtctgggga gtcagggtgc tggtcgtgga ggccaaggtg caggagctgc agcagcagct 12 00 
gcaggtggag ccgggcaggg aggttatggt ggtctgggga gtcagggcgc tggtcgtggg 12 60 
ggactgggtg gccaaggtgc aggagcagct gcagctgctg caggtggagc cgggcaggga 1320 
ggttatggtg gtctggggag tcagggtgct ggtcgtggag gccaaggtgc aggagctgca 1380 
gcagcagctg caggtggagc cgggcaggga ggttatggtg gtctggggag tcagggtgct 1440 
ggtcgtggag gccaaggtgc aggagctgca gcagcagctg caggtggagc cgggcaggga 1500 
ggttatggtg gtctgggggg ccagggtgct ggccaaggag gttatggtgg tctggggagt 1560 
cagggcgctg gtcgtggggg a^tgggtggc caaggtgcag gagctgctgc tgcagctgca 1620 
ggtggagccg ggcagggagg tctgggaggg cagggagcgg gccaaggtgc aggagcagct 1680 
gcagcagctg caggtggagc cgggcaggga ggttatggtg gtctggggag tcagggtgct 1740 
ggtcgtggag gccaaggtgc aggagctgca gcagcagctg caggtggagc cgggcaggga 1800 
ggttatggtg gtctggggag tcagggcgct ggtcgtgggg gactgggtgg ccaaggtgca 1860 



20 



DE 101 13 781 A 1 



ggagcagctg cagctgctgc aggtggagcc 
cagggtgctg gccaaggagg ttatggtggt 
ctgggtggcc aaggtgcagg agctgctgct 
ctgggagggc agggagcggg ccaaggtgca 
gggcagggag gttatggtgg tctggggagt 
caaggtgcag gagcagctgc agctgctgca 
ctggggagtc agggtgctgg tcgtggaggc 
ggtggagccg ggcagggagg ttatggtggt 
ctgggtggcc aaggtgcagg agcagctgca 
tatggtggtc tggggagtca gggtgctggt 
gcagctgcag gtggagccgg gcagggaggt 
cgtggaggcc aaggtgcagg agctgcagca 
tatggtggtc tggggggcca gggtgctggc 
ggcgctggtc gtgggggact gggtggccaa 
ggagccgggc agggaggtct gggagggcag 
gcagctgcag gtggagccgg gcagggaggt 
cgtggaggcc aaggtgcagg agctgcagca 
tatggtggtc tggggagtca gggcgctggt 
gcagctgcag ctgctgcagg tggagccggc 



gggcagggag gttatggtgg tctggggggc 1920 
ctggggagtc agggcgctgg tcgtggggga 1980 
gcagctgcag gtggagccgg gcagggaggt 2040 
ggagcagctg cagcagctgc aggtggagcc 2100 
cagggcgctg gtcgtggggg actgggtggc 2160 
ggtggagccg ggcagggagg ttatggtggt 2220 
caaggtgcag gagctgcagc agcagctgca 22 80 
ctggggagtc agggcgctgg tcgtggggga 234 0 
gctgctgcag gtggagccgg gcagggaggt 24 00 
cgtggaggcc aaggtgcagg agctgcagca 2460 
tatggtggtc tggggagtca gggtgctggt 2520 
gcagctgcag gtggagccgg gcagggaggt 2580 
caaggaggtt atggtggtct ggggagtcag 2640 
ggtgcaggag ctgctgctgc agctgcaggt 2700 
ggagcgggcc aaggtgcagg agcagctgca 2760 
tatggtggtc tggggagtca gggtgctggt 2820 
gcagctgcag gtggagccgg gcagggaggt 2880 
cgtgggggac tgggtggcca aggtgcagga 2 940 
ggacaagcgg ccgca 2985 



<210> 24 
<211> 5658 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz :Konstrukt 
S01SO1SO1 

<400> 24 

ggatcccagt tacccgggca gggaggttat ggtggtctgg ggggccaggg tgctggccaa 60 
ggaggttatg gtggtctggg gggccagggt gctggccaag gtgcaggagc tgctgctgca 120 
gctgcaggtg gagccgggca gggaggttat ggtggtctgg ggagtcaggg tgctggtcgt 180 
ggaggccaag gtgcaggagc tgcagcagca gctgcaggtg gagccgggca gggaggttat 24 0 
ggtggtctgg ggagtcaggg cgctggtcgt gggggactgg gtggccaagg tgcaggagca 3 00 
gctgcagctg ctgcaggtgg agccgggcag ggaggttatg gtggtctggg gagtcagggt 360 
gctggtcgtg gaggccaagg tgcaggagct gcagcagcag ctgcaggtgg agccgggcag 420 
ggaggttatg gtggtctggg gagtcagggc gctggtcgtg ggggactggg tggccaaggt 480 
gcaggagcag ctgcagctgc tgcaggtgga gccgggcagg gaggttatgg tggtctgggg 54 0 
ggccagggtg ctggccaagg aggttatggt ggtctgggga gtcagggcgc tggtcgtggg 600 
ggactgggtg gccaaggtgc aggagctgct gctgcagctg caggtggagc cgggcaggga 660 
ggtctgggag ggcagggagc gggccaaggt gcaggagcag ctgcagcagc tgcaggtgga 720 
gccgggcagg gaggttatgg tggtctgggg agtcagggtg ctggtcgtgg aggccaaggt 780 
gcaggagctg cagcagcagc tgcaggtgga gccgggcagg gaggttatgg tggtctgggg 840 
ggccagggtg ctggccaagg aggttatggt ggtctgggga gtcagggcgc tggtcgtggg 900 
ggactgggtg gccaaggtgc aggagctgct gctgcagctg caggtggagc cgggcaggga 960 
ggtctgggag ggcagggagc gggccaaggt gcaggagcag ctgcagcagc tgcaggtgga 1020 
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gccgggcagg gaggttatgg tggtctgggg 
ggccaaggtg caggagcagc tgcagctgct 
ggtctgggga gtcagggtgc tggtcgtgga 
gcaggtggag ccgggcaggg aggttatggt 
ggactgggtg gccaaggtgc aggagcagct 
ggttatggtg gtctggggag tcagggtgct 
gcagcagctg caggtggagc cgggcaggga 
ggtcgtggag gccaaggtgc aggagctgca 
ggttatggtg gtctgggggg ccagggtgct 
cagggcgctg gtcgtggggg actgggtggc 
ggtggagccg ggcagggagg tctgggaggg 
gcagcagctg caggtggagc cgggcaggga 
ggtcgtggag gccaaggtgc aggagctgca 
ggttatggtg gtctggggag tcagggcgct 
ggagcagctg cagctgctgc aggtggagcc 
cagggtgctg gccaaggagg ttatggtggt 
ggagctgctg ctgcagctgc aggtggagcc 
cagggtgctg gtcgtggagg ccaaggtgca 
gggcagggag gttatggtgg tctggggagt 
caaggtgcag gagcagctgc agctgctgca 
ctggggagtc agggtgctgg tcgtggaggc 
ggtggagccg ggcagggagg ttatggtggt 
ctgggtggcc aaggtgcagg agcagctgca 
tatggtggtc tggggggcca gggtgctggc 
ggcgctggtc gtgggggact gggtggccaa 
ggagccgggc agggaggtct gggagggcag 
gcagctgcag gtggagccgg gcagggaggt 
cgtggaggcc aaggtgcagg agctgcagca 
tatggtggtc tggggggcca gggtgctggc 
ggcgctggtc gtgggggact gggtggccaa 
ggagccgggc agggaggtct gggagggcag 
gcagctgcag gtggagccgg gcagggaggt 
cgtgggggac tgggtggcca aggtgcagga 
cagggaggtt atggtggtct ggggagtcag 
gctgcagcag cagctgcagg tggagccggg 
ggcgctggtc gtgggggact gggtggccaa 
ggagccgggc agggaggtta tggtggtctg 
ggtgcaggag ctgcagcagc agctgcaggt 
gggagtcagg gtgctggtcg tggaggccaa 
ggagccgggc agggaggtta tggtggtctg 
ggtggtctgg ggagtcaggg cgctggtcgt 
gctgctgcag ctgcaggtgg agccgggcag 
ggtgcaggag cagctgcagc agctgcaggt 
gggagtcagg gtgctggtcg tggaggccaa 
ggagccgggc agggaggtta tggtggtctg 
ggtggccaag gtgcaggagc agctgcagct 
ggtggtctgg ggggccaggg tgctggccaa 
gctggccaag gtgcaggagc tgctgctgca 



agtcagggcg ctggtcgtgg gggactgggt 1080 
gcaggtggag ccgggcaggg aggttatggt 114 0 
ggccaaggtg caggagctgc agcagcagct 1200 
ggtctgggga gtcagggcgc tggtcgtggg 1260 
gcagctgctg caggtggagc cgggcaggga 1320 
ggtcgtggag gccaaggtgc aggagctgca 1380 
ggttatggtg gtctggggag tcagggtgct 1440 
gcagcagctg caggtggagc cgggcaggga 1500 
ggccaaggag gttatggtgg tctggggagt 1560 
caaggtgcag gagctgctgc tgcagctgca 1620 
cagggagcgg gccaaggtgc aggagcagct 1680 
ggttatggtg gtctggggag tcagggtgct 1740 
gcagcagctg caggtggagc cgggcaggga 1800 
ggtcgtgggg gactgggtgg ccaaggtgca 1860 
gggcagggag gttatggtgg tctggggggc 1920 
ctggggggcc agggtgctgg ccaaggtgca 1980 
gggcagggag gttatggtgg tctggggagt 2 040 
ggagctgcag cagcagctgc aggtggagcc 2100 
cagggcgctg gtcgtggggg actgggtggc 2160 
ggtggagccg ggcagggagg ttatggtggt 2220 
caaggtgcag gagctgcagc agcagctgca 2280 
ctggggagtc agggcgctgg tcgtggggga 2340 
gctgctgcag gtggagccgg gcagggaggt 2400 
caaggaggtt atggtggtct ggggagtcag 2460 
ggtgcaggag ctgctgctgc agctgcaggt 2520 
ggagcgggcc aaggtgcagg agcagctgca 2580 
tatggtggtc tggggagtca gggtgctggt 264 0 
gcagctgcag gtggagccgg gcagggaggt 2700 
caaggaggtt atggtggtct ggggagtcag 2760 
ggtgcaggag ctgctgctgc agctgcaggt 2820 
ggagcgggcc aaggtgcagg agcagctgca 2 880 
tatggtggtc tggggagtca gggcgctggt 2 940 
gcagctgcag ctgctgcagg tggagccggg 3 000 
ggtgctggtc gtggaggcca aggtgcagga 3060 
cagggaggtt atggtggtct ggggagtcag 3120 
ggtgcaggag cagctgcagc tgctgcaggt 3180 
gggagtcagg gtgctggtcg tggaggccaa 324 0 
ggagccgggc agggaggtta tggtggtctg 33 00 
ggtgcaggag ctgcagcagc agctgcaggt 3360 
gggggccagg gtgctggcca aggaggttat 3420 
ggggg ac tgg gtggccaagg tgcaggagct 34 80 
ggaggtctgg gagggcaggg agcgggccaa 3540 
ggagccgggc agggaggtta tggtggtctg 3600 
ggtgcaggag ctgcagcagc agctgcaggt 3660 
gggagtcagg gcgctggtcg tgggggactg 3720 
gctgcaggtg gagccgggca gggaggttat 3780 
ggaggttatg gtggtctggg gggccagggt 3840 
gctgcaggtg gagccgggca gggaggttat 3900 
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ggtggtctgg ggagtcaggg tgctggtcgt 
gctgcaggtg gagccgggca gggaggttat 
gggggactgg gtggccaagg tgcaggagca 
ggaggttatg gtggtctggg gagtcagggt 
gcagcagcag ctgcaggtgg agccgggcag 
gctggtcgtg ggggactggg tggccaaggt 
gccgggcagg gaggttatgg tggtctgggg 
ggtctgggga gtcagggcgc tggtcgtggg 
gctgcagctg caggtggagc cgggcaggga 
gcaggagcag ctgcagcagc tgcaggtgga 
agtcagggtg ctggtcgtgg aggccaaggt 
gccgggcagg gaggttatgg tggtctgggg 
ggtctgggga gtcagggcgc tggtcgtggg 
gctgcagctg caggtggagc cgggcaggga 
gcaggagcag ctgcagcagc tgcaggtgga 
agtcagggcg ctggtcgtgg gggactgggt 
gcaggtggag ccgggcaggg aggttatggt 
ggccaaggtg caggagctgc agcagcagct 
ggtctgggga gtcagggcgc tggtcgtggg 
gcagctgctg caggtggagc cgggcaggga 
ggtcgtggag gccaaggtgc aggagctgca 
ggttatggtg gtctggggag tcagggtgct 
gcagcagctg caggtggagc cgggcaggga 
ggccaaggag gttatggtgg tctggggagt 
caaggtgcag gagctgctgc tgcagctgca 
cagggagcgg gccaaggtgc aggagcagct 
ggttatggtg gtctggggag tcagggtgct 
gcagcagctg caggtggagc cgggcaggga 
ggtcgtgggg gactgggtgg ccaaggtgca 
ggcggacaag cggccgca 



ggaggccaag gtgcaggagc tgcagcagca 3960 
ggtggtctgg ggagtcaggg cgctggtcgt 4020 
gctgcagctg ctgcaggtgg agccgggcag 4080 
gctggtcgtg gaggccaagg tgcaggagct 4140 
ggaggttatg gtggtctggg gagtcagggc 4200 
gcaggagcag ctgcagctgc tgcaggtgga 4260 
ggccagggtg ctggccaagg aggttatggt 4320 
ggactgggtg gccaaggtgc aggagctgct 4380 
ggtctgggag ggcagggagc gggccaaggt 4440 
gccgggcagg gaggttatgg tggtctgggg 4500 
gcaggagctg cagcagcagc tgcaggtgga 4560 
ggccagggtg ctggccaagg aggttatggt 4620 
ggactgggtg gccaaggtgc aggagctgct 4680 
ggtctgggag ggcagggagc gggccaaggt 474 0 
gccgggcagg gaggttatgg tggtctgggg 4800 
ggccaaggtg caggagcagc tgcagctgct 4860 
ggtctgggga gtcagggtgc tggtcgtgga 4 920 
gcaggtggag ccgggcaggg aggttatggt 4980 
ggactgggtg gccaaggtgc aggagcagct 5040 
ggttatggtg gtctggggag tcagggtgct 5100 
gcagcagctg caggtggagc cgggcaggga 5160 
ggtcgtggag gccaaggtgc aggagctgca 5220 
ggttatggtg gtctgggggg ccagggtgct 5280 
cagggcgctg gtcgtggggg actgggtggc 5340 
ggtggagccg ggcagggagg tctgggaggg 5400 
gcagcagctg caggtggagc cgggcaggga 54 60 
ggtcgtggag gccaaggtgc aggagctgca 5520 
ggttatggtg gtctggggag tcagggcgct 5580 
ggagcagctg cagctgctgc aggtggagcc 5640 

5658 



<210> 25 
<211> 672 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz :Konstrukt FA2 
<400> 25 

ggatcccagt tagggcaggg aggttatggt ggtctggggg gccagggtgc tggccaagga 60 
ggttatggtg gtctggggag tcagggcgct ggtcgtgggg gactgggtgg ccaaggtgca 120 
ggagctgctg ctgcagctgc aggtggagcc gggcagggag gtctgggagg gcagggagcg 180 
ggccaaggtg caggagcagc tgcagcagct gcaggtggag ccgggcaggg aggttatggt 240 
ggtctgggga gtcagggcgc tggtcgtggg ggactgggtg gccaaggtgc aggagcagct 300 
gcagctgctg caggtggagc cgggtccgga agtggtgcag gtgccggaag cggagcagga 360 
gccggtgccg gatctggtgc cggtgccgga agcggtgctg gtgccggaag cggtgctggt 420 
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gccggatcag gagcgggtgc cggttatggt 
tatggagcgg gagccggtgt tgggtacgga 
gcaggagccg gtgccggagc tgggacaggg 
ggtggttatt caggctatga atacgcgtgg 
caagcggccg ca 



gcgggagccg gtgttgggta cggagccggt 480 
gccggtgcag gttccggggc cgcaagcggc 540 
agttcaggat ttgggcccta cgttgcaaat 600 
agtagtaagt ctgattttga gactgccgga 660 

672 



<210> 26 
<211> 525 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz rKonstrukt SA1 
<400> 26 

ggatcccagt tagggcaggg aggttatggt ggtctggggg gccagggtgc tggccaagga 60 
ggttatggtg gtctgggggg ccagggtgct ggccaaggtg caggagctgc tgctgcagct 120 
gcaggtggag ccgggcaggg aggttatggt ggtctgggga gtcagggtgc tggtcgtgga 180 
ggccaaggtg caggagctgc agcagcagct gcaggtggag ccgggcaggg aggttatggt 240 
ggtctgggga gtcagggcgc tggtcgtggg ggactgggtg gccaaggtgc aggagcagct 300 
gcagctgctg caggtggagc cgggcaggga ggttatggtg gtctggggag tcagggtgct 360 
ggtcgtggag gccaaggtgc aggagctgca gcagcagctg caggtggagc cgggcaggga 420 
ggttatggtg gtctggggag tcagggcgct ggtcgtgggg gactgggtgg ccaaggtgca 4 80 
ggagcagctg cagctgctgc aggtggagcc ggacaagcgg ccgca 525 



<210> 27 
<211> 1908 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz rKonstrukt SOI 
<400> 27 

ggatcccagt tacccgggca gggaggttat ggtggtctgg 
ggaggttatg gtggtctggg gggccagggt gctggccaag 
gctgcaggtg gagccgggca gggaggttat ggtggtctgg 
ggaggccaag gtgcaggagc tgcagcagca gctgcaggtg 
99tggtctgg ggagtcaggg cgctggtcgt gggggactgg 
gctgcagctg ctgcaggtgg agccgggcag ggaggttatg 
gctggtcgtg gaggccaagg tgcaggagct gcagcagcag 
ggaggttatg gtggtctggg gagtcagggc gctggtcgtg 
gcaggagcag ctgcagctgc tgcaggtgga gccgggcagg 
ggccagggtg ctggccaagg aggttatggt ggtctgggga 
ggactgggtg gccaaggtgc aggagctgct gctgcagctg 
ggtctgggag ggcagggagc gggccaaggt gcaggagcag 



ggggccaggg 


tgctggccaa 


60 


gtgcaggagc 


tgctgctgca 


120 


ggagtcaggg 


tgctggtcgt 


180 


gagccgggca 


gggaggttat 


240 


gtggccaagg 


tgcaggagca 


300 


gtggtctggg 


gagtcagggt 


360 


ctgcaggtgg 


agccgggcag 


420 


ggggactggg 


tggccaaggt 


480 


gaggttatgg 


tggtctgggg 


540 


gtcagggcgc 


tggtcgtggg 


600 


caggtggagc 


cgggcaggga 


660 


ctgcagcagc 


tgcaggtgga 


720 
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gccgggcagg gaggttatgg tggtctgggg agtcagggtg ctggtcgtgg aggccaaggt 780 
gcaggagctg cagcagcagc tgcaggtgga gccgggcagg gaggttatgg tggtctgggg 840 
ggccagggtg ctggccaagg aggttatggt ggtctgggga gtcagggcgc tggtcgtggg 900 
ggactgggtg gccaaggtgc aggagctgct gctgcagctg caggtggagc cgggcaggga 960 
ggtctgggag ggcagggagc gggccaaggt gcaggagcag ctgcagcagc tgcaggtgga 1020 
gccgggcagg gaggttatgg tggtctgggg agtcagggcg ctggtcgtgg gggactgggt 1080 
ggccaaggtg caggagcagc tgcagctgct gcaggtggag ccgggcaggg aggttatggt 1140 
ggtctgggga gtcagggtgc tggtcgtgga ggccaaggtg caggagctgc agcagcagct 1200 
gcaggtggag ccgggcaggg aggttatggt ggtctgggga gtcagggcgc tggtcgtggg 1260 
gigactgggtg gccaaggtgc aggagcagct gcagctgctg caggtggagc cgggcaggga 1320 
ggttatggtg gtctggggag tcagggtgct ggtcgtggag gccaaggtgc aggagctgca 13 80 
gcagcagctg caggtggagc cgggcaggga ggttatggtg gtctggggag tcagggtgct 1440 
ggtcgtggag gccaaggtgc aggagctgca gcagcagctg caggtggagc cgggcaggga 1500 
ggttatggtg gtctgggggg ccagggtgct ggccaaggag gttatggtgg tctggggagt 1560 
cagggcgctg gtcgtggggg actgggtggc caaggtgcag gagctgctgc tgcagctgca 1620 
ggtggagccg ggcagggagg tctgggaggg cagggagcgg gccaaggtgc aggagcagct 1680 
gcagcagctg caggtggagc cgggcaggga ggttatggtg gtctggggag tcagggtgct 174 0 
ggtcgtggag gccaaggtgc aggagctgca gcagcagctg caggtggagc cgggcaggga 1800 
ggttatggtg gtctggggag tcagggcgct ggtcgtgggg gactgggtgg ccaaggtgca 1860 
ggagcagctg cagctgctgc aggtggagcc ggcggacaag cggccgca 1908 

<210> 28 
<211> 1110 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : Konstrukt 
SM12 

<400> 28 

ggatcccagt tacccgggca gggaggttat ggtggtctgg ggggccaggg tgctggccaa 60 
ggaggttatg gtggtctggg gagtcagggc gctggtcgtg ggggactggg tggccaaggt 120 
gcaggagctg ctgctgcagc tgcaggtgga gccgggcagg gaggtctggg agggcaggga 180 
gcgggccaag gtgcaggagc agctgcagca gctgcaggtg gagccgggca gggaggttat 240 
ggtggtctgg ggagtcaggg cgctggtcgt gggggactgg gtggccaagg tgcaggagca 300 
gctgcagctg ctgcaggtgg agccgggcag ggaggttatg gtggtctggg gagtcagggt 360 
gctggtcgtg gaggccaagg tgcaggagct gcagcagcag ctgcaggtgg agccgggcag 420 
ggaggttatg gtggtctggg gagtcagggc gctggtcgtg ggggactggg tggccaaggt 480 
gcaggagcag ctgcagctgc tgcaggtgga gccgggcagg gaggttatgg tggtctgggg 540 
agtcagggtg ctggtcgtgg aggccaaggt gcaggagctg cagcagcagc tgcaggtgga 600 
gccgggcagg gaggttatgg tggtctgggg agtcagggtg ctggtcgtgg aggccaaggt 660 
gcaggagctg cagcagcagc tgcaggtgga gccgggcagg gaggttatgg tggtctgggg 720 
ggccagggtg ctggccaagg aggttatggt ggtctgggga gtcagggcgc tggtcgtggg 780 
ggactgggtg gccaaggtgc aggagctgct gctgcagctg caggtggagc cgggcaggga 84 0 
ggtctgggag ggcagggagc gggccaaggt gcaggagcag ctgcagcagc tgcaggtgga 900 
gccgggcagg gaggttatgg tggtctgggg agtcagggtg ctggtcgtgg aggccaaggt 960 
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gcaggagctg cagcagcagc tgcaggtgga gccgggcagg gaggttatgg tggtctgggg 1020 
agtcagggcg ctggtcgtgg gggactgggt ggccaaggtg caggagcagc tgcagctgct 1080 
gcaggtggag ccggcggaca agcggccgca 1110 

<210> 29 
<211> 831 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : Konstrukt SF1 
<400> 29 

ggatcccagt tacccgggca gggaggttat ggtggtctgg ggggccaggg tgctggccaa 60 

ggaggttatg gtggtctggg gggccagggt gctggccaag gtgcaggagc tgctgctgca 120 

gctgcaggtg gagccgggca gggaggttat ggtggtctgg ggagtcaggg tgctggtcgt 180 

ggaggccaag gtgcaggagc tgcagcagca gctgcaggtg gagccgggca gggaggttat 240 

ggtggtctgg ggagtcaggg cgctggtcgt gggggactgg gtggccaagg tgcaggagca 300 

gctgcagctg ctgcaggtgg agccgggcag ggaggttatg gtggtctggg gagtcagggt 360 

gctggtcgtg gaggccaagg tgcaggagct gcagcagcag ctgcaggtgg agccgggcag 420 

ggaggttatg gtggtctggg gagtcagggc gctggtcgtg ggggactggg tggccaaggt 4 80 

gcaggagcag ctgcagctgc tgcaggtgga gccgggcagg gaggttatgg tggtctgggg 540 

ggccagggtg ctggccaagg aggttatggt ggtctgggga gtcagggcgc tggtcgtggg 600 

ggactgggtg gccaaggtgc aggagctgct gctgcagctg caggtggagc cgggcaggga 660 

ggtctgggag ggcagggagc gggccaaggt gcaggagcag ctgcagcagc tgcaggtgga 720 

gccgggcagg gaggttatgg tggtctgggg agtcagggtg ctggtcgtgg aggccaaggt 780 

gcaggagctg cagcagcagc tgcaggtgga gccggcggac aagcggccgc a 831 

<210> 30 
<211> 104 
<212> PRT 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : SB1 -Protein 
<400> 30 

Gly Gin Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly 
15 10 15 

Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly 
20 25 30 

Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin 
35 40 45 
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Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Ala Gly Ala Ala Ala 
50 55 60 

Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser 
65 70 75 80 

Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala 
85 90 95 

Ala Gly Gly Ala Gly Gin Ala Ala 
100 



<210> 31 
<211> 230 
<212> PRT 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : SEl-Protein 
<400> 31 

Gly Gin Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly 
15 10 15 

Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly 
20 25 30 

Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin 
35 40 45 

Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Ala Gly Ala Ala Ala 
50 55 60 

Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser 
65 70 75 80 

Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala 
85 90 95 

Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly 
100 105 110 

Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala 
115 120 125 

Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin 
130 135 140 
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Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala 
145 150 155 160 

5 Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser 
165 170 175 

io Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala 
180 185 190 

Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly 
15 195 200 205 



20 



Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly 
210 215 220 



Gly Ala Gly Gin Ala Ala 
225 230 

25 

<210> 32 
<211> 137 

30 

<212> PRT 

<213> Kunstliche Sequenz 
35 <220> 

<223> Beschreibung der kunst lichen Sequenz : SDl-Protein 
<400> 32 

40 Gly Gin Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly 
15 10 15 

45 Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly 
20 25 30 

Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin 
50 3 5 4 0 4 5 

Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Ala Gly Ala Ala Ala 
50 55 60 

Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser 
65 70 75 80 

60 

Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala 
85 90 95 

65 Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly 



55 
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100 105 110 

Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala 
115 120 125 

Ala Ala Gly Gly Ala Gly Gin Ala Ala 
130 135 



<210> 33 

<211> 1255 . 15 

<212> PRT 

<213> Kunstliche Sequenz 

20 

<220> 

<223> Beschreibung der kunstlichen 
Sequenz : SOlSOl-Protein 

25 

<400> 33 

Gly Gin Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly 
15 10 15 

30 

Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Ala Gly Ala 
20 25 30 

35 

Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu 
35 40 45 

Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala 40 
50 55 60 

Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser 45 
65 70 75 80 

Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala 

85 90 95 50 

Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly 
100 105 110 

55 

Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala 
115 120 125 

60 

Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin 
130 135 140 

Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala 65 
145 150 155 160 
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Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Gly 
165 170 175 

Gin Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala 
180 185 190 

l0 Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala 
195 200 205 



Ala Gly Gly Ala Gly Gin Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin 



15 



210 



215 



220 



20 



Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly 
225 230 235 240 



25 



Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala 
245 250 255 

Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly 
260 265 270 



30 



Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly 
275 280 285 



35 Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala 
290 295 300 



Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Leu Gly Gly Gin 



40 



305 



310 



315 



320 



45 



Gly Ala Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala 
325 330 335 



50 



Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly 
340 345 350 

Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly 
355 360 365 



55 



Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg 
370 375 380 



60 Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly 
385 390 395 400 



Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly 
65 405 410 415 
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Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala 
420 425 430 

Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly 
435 440 445 

Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin 
450 455 460 

Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin 
465 470 475 480 

Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly 
485 490 495 

Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Gly Tyr Gly Gly 
500 505 510 

Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala 
515 520 525 

Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Leu Gly 
530 535 540 

Gly Gin Gly Ala Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly 
545 550 555 560 

Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly 
565 570 575 

Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala 
580 585 590 

Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly 
595 600 605 

Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly 
610 615 620 

Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin 
625 630 635 640 

Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Ala Gly 
645 650 655 



Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly 
660 665 670 
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Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala 

675 680 685 

5 Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly 

690 695 700 

10 Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala 

705 710 715 720 



15 



Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu 



725 



730 



735 



20 



Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala 
740 745 750 



25 



30 



Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser 
755 760 765 

Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala 
770 775 780 

Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly 

785 790 795 800 



35 Gly Gin Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly 
805 810 815 



Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala 



40 



820 



825 



830 



45 



Ala Ala Gly Gly Ala Gly Gin Gly Gly Leu Gly Gly Gin Gly Ala Gly 
835 840 845 



50 



Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly 

850 855 860 

Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly 

865 870 875 880 



55 



Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr 
885 890 895 



60 Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu 
900 905 910 



Gly Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly 
65 915 920 925 
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Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Leu Gly Gly 
930 935 940 

5 

Gin Gly Ala Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly 
945 950 955 960 

Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg l0 
965 970 975 

Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly 

980 985 990 15 

Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly 

995 1000 1005 20 

Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala 
1010 1015 1020 

25 

Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly 
1025 1030 1035 1040 

30 

Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly 
1045 1050 1055 

Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg 35 
1060 1065 1070 

Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly 

1075 1080 1085 40 

Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly 

1090 1095 1100 45 

Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly 
1105 1110 1115 1120 

50 

Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Gly Tyr Gly 
1125 1130 1135 

Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly 55 
1140 1145 1150 

Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Leu ^ 
1155 1160 1165 

Gly Gly Gin Gly Ala Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala 

1170 1175 1180 65 
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Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala 
1185 1190 1195 1200 

5 

Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly 
1205 1210 1215 

io Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg 
1220 1225 1230 

Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly 
15 1235 1240 1245 

Gly Ala Gly Gly Gin Ala Ala 
1250 1255 



<210> 34 
25 <211> 989 
<212> PRT 

<213> Kunstliche Sequenz 



30 

<220> 



<223> Beschreibung der kunstlichen 
Sequenz : S01SM12 -Protein 

35 

<400> 34 

Gly Gin Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly 
15 10 15 

40 

Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Ala Gly Ala 
20 25 30 

45 

Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu 
35 40 45 

50 Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala 
50 55 60 

Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser 
55 65 70 75 80 

Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala 
60 85 90 95 

Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly 
100 105 110 

65 
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Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala 
115 120 125 

5 

Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin 
130 135 140 

Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala io 
145 150 155 160 

Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Gly 

165 170 175 15 

Gin Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala 

180 185 190 20 

Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala 
195 200 205 

25 

Ala Gly Gly Ala Gly Gin Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin 
210 215 220 

30 

Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly 
225 230 235 240 

Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala 35 
245 250 255 

Gly Ala Ala Ala Ala Aia Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly 

260 265 270 40 

Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly 

275 280 285 45 

Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala 
290 295 300 

50 

Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Leu Gly Gly Gin 
305 310 315 320 

Gly Ala Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala 55 
325 330 335 

Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly ^ 
340 345 350 

Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly 

355 360 365 65 
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Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg 
370 375 380 

5 Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly 
385 390 395 400 

to Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly 
405 410 415 



Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala 



15 



420 



425 



430 



20 



Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly 
435 440 445 



25 



Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin 

450 455 460 

Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin 

465 470 475 480 



30 



Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly 
"485 490 495 



35 Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Gly Tyr Gly Gly 
500 505 510 



Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala 



40 



515 



520 



525 



45 



Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Leu Gly 
530 535 540 



50 



Gly Gin Gly Ala Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly 

545 550 555 560 

Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly 
565 570 575 



55 



Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala 
580 585 590 



60 Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly 
595 600 605 



Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly 
65 610 615 620 
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Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin 
625 630 635 640 

Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Leu 
645 650 655 

Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly 
660 665 670 

Gin Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Ala Gly Ala Ala 
675 680 685 

Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly 
690 695 700 

Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala 
705 710 715 720 

Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu 
725 730 735 

Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala 
740 745 750 

Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser 
755 760 765 

Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala 
770 775 780 

Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly 
785 790 795 800 

Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala 
805 810 815 

Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Giy Leu Gly Ser Gin 
820 825 830 

Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala 
835 840 845 

Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala 
850 855 860 



Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly 
865 870 875 880 
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Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly 
885 890 895 

5 

Ala Gly Gin Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Ala Gly 
900 905 910 

lo Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly 
915 920 925 



Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala 
15 930 935 940 

Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly 
20 945 950 955 960 

Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala 
965 970 975 

25 

Ala Ala Ala Ala Ala Gly Gly Ala Gly Gly Gin Ala Ala 
980 985 

30 

<210> 35 
<211> 1880 
35 <212> PRT 

<213> Kunstliche Sequenz 

<220> 

40 <223> Beschreibung der kunstlichen 
Sequenz : SOISOISOI -Protein 

45 <400> 35 

Gly' Gin Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly 
15 10 15 

50 Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Ala Gly Ala 
20 25 30 

Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu 
5 " 35 40 45 

Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala 
60 50 55 60 

Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser 
65 70 75 80 

65 

Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala 
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85 



90 



95 



Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly 
100 105 110 

Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala 
115 120 125 

Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin 
130 135 140 

Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala 
145 150 155 160 

Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Gly 
165 170 175 

Gin Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala 
180 185 190 

Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala 
195 200 205 

Ala Gly Gly Ala Gly Gin Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin 
210 215 220 

Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly 
225 230 235 240 

Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala 
245 250 255 

Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly 
260 265 270 

Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly 
275 280 285 

Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala 
290 295 300 

Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Leu Gly Gly Gin 
305 310 315 320 

Gly Ala Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala 
325 330 335 



Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly 
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345 350 



Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly 



355 



360 



365 



Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg 

to 370 375 380 

Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly 
385 390 395 400 



15 



20 



Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly 
405 410 415 

Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala 
420 425 430 



25 Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly 
435 440 445 



30 



Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin 



450 



455 



460 



Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin 

35 465 470 475 480 

Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly 

485 490 495 



40 



45 



Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Gly Tyr Gly Gly 

500 505 510 

Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala 
515 520 525 



50 Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Leu Gly 
530 535 540 



55 



Gly Gin Gly Ala Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly 



545 



550 



555 



560 



Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly 
60 565 570 575 

Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala 
580 585 590 



65 



Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly 
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595 



600 



605 



Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly 
610 615 620 

Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin 
625 630 635 640 

Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Ala Gly 
645 650 655 

Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly 
660 665 670 

Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala 
675 680 685 

Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly 
690 695 700 

Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala 
705 710 715 720 

Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu 
725 730 735 

Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala 
740 745 750 

Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser 
755 760 76S 

Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala 
770 775 780 

Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly 
785 790 795 800 

Gly Gin Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly 
805 810 815 

Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala 
820 825 830 

Ala Ala Gly Gly Ala Gly Gin Gly Gly Leu Gly Gly Gin Gly Ala Gly 
835 840 845 



Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly 
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850 855 860 

Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly 
865 870 875 880 

Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr 
to 885 890 895 

Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu 
900 905 910 

15 

Gly Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly 
915 920 925 

20 

Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Leu Gly Gly 
930 935 940 

25 Gin Gly Ala Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly 
945 950 .955 . 960 

Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg 
965 970 975 

Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly 
35 980 985 990 

Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly 
995 1000 1005 

40 

Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala 
1010 1015 1020 

45 

Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly 
1025 1030 1035 1040 

50 Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly 
1045 1050 1055 

Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg 
1060 1065 1070 

Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly 
60 1075 1080 1085 

Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly 
1090 1095 1100 

65 

Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly 
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1105 1110 1115 1120 

Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Gly Tyr Gly 
1125 1130 1135 

Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly 
1140 1145 1150 

Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Leu 
1155 1160 1165 

Gly Gly Gin Gly Ala Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala 
1170 1175 1180 

Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala 
1185 1190 1195 1200 

Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly 
1205 1210 1215 

Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg 
1220 1225 1230 

Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly 
1235 1240 1245 

Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly 
1250 1255 1260 

Gin Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Ala 
1265 1270 1275 1280 

Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly 
1285 1290 1295 

Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala 
1300 1305 1310 

Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu 
1315 1320 1325 

Gly Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly 
1330 1335 1340 

Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly 
1345 1350 1355 1360 

Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala 
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1365 1370 1375 

Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly 
1380 1385 1390 

Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala 
l0 1395 1400 1405 

Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu 
1410 1415 1420 

15 

Gly Gly Gin Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin 
1425 1430 1435 1440 

20 

Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala 
1445 1450 1455 

25 Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Leu Gly Gly Gin Gly Ala 
1460 1465 1470 

Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin 
1475 14 80 1485 

Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin 
35 1490 1495 1500 

Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly 
1505 1510 1515 1520 

40 

Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Gly Tyr Gly Gly 
1525 1530 1535 

45 

Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala 
1540 1545 1550 

so Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Leu Gly 
1555 1560 1565 

Gly Gin Gly Ala Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly 
1570 1575 1580 

Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly 
60 1585 1590 1595 1600 

Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala 
1605 1610 1615 

65 

Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala 
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1620 1625 1630 

Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly 
1635 1640 1645 

Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg 
1650 1655 1660 

Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly 
1665 1670 1675 1680 

Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly 
1685 1690 1695 

Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala 
1700 1705 1710 

Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly 
1715 1720 1725 

Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin 
1730 1735 1740 

Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Gly Tyr 
1745 1750 1755 1760 

Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin 
1765 1770 1775 

Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly 
1780 1785 1790 

Leu Gly Gly Gin Gly Ala Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala 
1795 1800 1805 

Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly 
1810 1815 1820 

Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly 
1825 1830 1835 1840 

Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly 
1845 1850 1855 

Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala 
1860 1865 1870 

Gly Gly Ala Gly Gly Gin Ala Ala 
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1875 1880 



5 <210> 36 
<211> 219 
<212> PRT 
io <213> Kunstliche Sequenz 

<220> 

<223> Beschreibung der kunstlichen Sequenz :FA2 -Protein 

15 

<400> 36 

Gly Gin Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly 
20 1 5 10 15 

Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly 
20 25 30 

25 

Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin 
35 40 45 

30 

Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Ala Gly Ala Ala Ala 
50 55 60 

35 Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser 
65 70 75 80 

Gin Gly Ala Gly Arg Gly Gly Leu- Gly Gly Gin Gly Ala Gly Ala Ala 
40 85 90 95 

Ala Ala Ala Ala Gly Gly Ala Gly Ser Gly Ser Gly Ala Gly Ala Gly 
100 105 110 

45 

Ser Gly Ala Gly Ala Gly Ala Gly Ser Gly Ala Gly Ala Gly Ser Gly 
115 120 125 

50 

Ala Gly Ala Gly Ser Gly Ala Gly Ala Gly Ser Gly Ala Gly Ala Gly 
130 135 140 

55 Tyr Gly Ala Gly Ala Gly Val Gly Tyr Gly Ala Gly Tyr Gly Ala Gly 
145 150 155 160 

to Ala Gly Val Gly Tyr Gly Ala Gly Ala Gly Ser Gly Ala Ala Ser Gly 
165 170 175 

Ala Gly Ala Gly Ala Gly Ala Gly Thr Gly Ser Ser Gly Phe Gly Pro 
65 180 185 190 
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Tyr Val Ala Asn Gly Gly Tyr Ser Gly Tyr Glu Tyr Ala Trp Ser Ser 
195 200 205 

Lys Ser Asp Phe Glu Thr Ala Gly Gin Ala. Ala 
210 215 



<210> 37 
<211> 170 
<212> PRT 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunst lichen Sequenz : SA1- Protein 
<400> 37 

Gly Gin Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly 
15 10 15 

Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Ala Gly Ala 
20 25 30 

Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu 
35 40 45 

Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala 
50 55 60 

Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser 
65 70 75 80 

Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala 
85 90 95 

Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly 
100 105 110 

Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala 
115 120 125 

Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin 
130 135 140 

Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala 
145 150 155 160 

Ala Ala Ala Gly Gly Ala Gly Gin Ala Ala 
165 170 
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<210> 38 

<211> 630 

<212> PRT 

<213> Kunstliche Sequenz 



<220> 

l0 <223> Beschreibung der kunstlichen Sequenz : SOl-Protein 
<400> 38 

Gly Gin Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly 
15 1 5 10 15 

Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Ala Gly Ala 
20 25 30 

20 

Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu 
35 40 45 

25 

Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala 
50 55 60 

30 

Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser 
65 70 75 80 

35 Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala 

85 90 95 

Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly 
40 100 105 110 

Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala 
115 120 125 

45 

Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin 
130 135 140 

50 

Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala 
145 150 155 160 

55 Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Gly 
165 170 175 

^ Gin Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala 
180 185 190 

Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala 

65 
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195 



200 



205 



Ala Gly Gly Ala Gly Gin Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin 
210 215 220 

Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly 
225 230 235 240 

Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala 
245 250 255 

Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly 
260 265 270 

Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly 
275 280 285 

Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala 
290 295 300 

Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Leu Gly Gly Gin 
305 310 315 320 

Gly Ala Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala 
325 330 335 

Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly 
340 345 350 

Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly 
355 360 365 

Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg 
370 375 380 

Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly 
385 390 395 400 

Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly 
405 410 415 

Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala 
420 425 430 

Gly Gin Gly Gly Tyr Gly Gly. Leu Gly Ser Gin Gly Ala Gly Arg Gly 
435 440 445 



Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin 
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450 455 460 

Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin 
5 465 470 475 480 

Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly 
l0 485 490 495 

Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Gly Tyr Gly Gly 
500 505 510 

15 

Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala 
515 520 525 

20 

Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Leu Gly 
530 535 540 

25 Gly Gin Gly Ala Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly 
545 550 555 560 

Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly 

30 

565 570 575 

Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala 
35 580 585 590 

Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly 
595 600 605 

40 

Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly 
610 615 620 

45 

Ala Gly Gly Gin Ala Ala 
625 630 

50 

<210> 39 
<211> 364 
<212> PRT 
55 <213> Kunstliche Sequenz 

<220> 

^ <223> Beschreibung der kunstlichen Sequenz : SM12 -Protein 
<400> 39 

Gly Gin Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly 
65 l 5 10 15 
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Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly 

20 25 30 

Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin 

35 40 45 



Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Ala Gly Ala Ala Ala 
50 55 60 



10 



Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser 
65 70 75 80 



15 



Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala 
85 90 95 



20 



Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly 
100 105 110 

Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala 
115 120 125 

Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin 
130 135 140 



25 



30 



Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala 
145 150 155 160 



35 



Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser 
165 170 175 



40 



Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala 
180 185 190 



45 



Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly 
195 200 205 

Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly 
210 215 220 

Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly 
225 230 235 240 



50 



55 



Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly 
245 250 255 



60 



Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala 
260 265 270 



65 
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Gly Gin Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Ala Gly Ala 
275 280 285 

5 Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu 
290 295 300 

10 Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala 
305 310 315 320 

Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser 
15 325 330 335 



20 



Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala 
340 345 350 



Ala Ala Ala Ala Gly Gly Ala Gly Gly Gin Ala Ala 
355 360 

25 

<210> 40 
<211> 271 

30 

<212> PRT 

<213> Kunstliche Sequenz 
35 <220> 

<223> Beschreibung der kiinstlichen Sequenz : SFl-Protein 
<400> 40 

40 Gly Gin Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly 
15 10 15 

45 Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Ala Gly Ala 
20 25 30 

Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu 
50 35 40 45 

Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala 
50 55 60 

55 

Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser 
65 70 75 80 

60 

Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala 
85 90 95 

65 Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly 
. 100 105 110 
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Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala 
115 120 125 

Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin 
130 135 140 

Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala 
145 150 155 160 

Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Gly 
165 170 175 

Gin Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala 
180 185 190 

Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala 
195 200 205 

Ala Gly Gly Ala Gly Gin Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin 
210 215 220 

Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly 
225 230 235 240 

Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala 
245 250 255 

Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gly Gin Ala Ala 
260 265 270 



<210> 41 
<211> 182 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen SequenzrELP mit 10 
Pentamereinheiten 

<400> 41 

ctcgagatgg gccacggcgt gggtgttccg ggcgtgggtg ttccgggtgg cggtgtgccg 60 
ggcgcaggtg ttcctggtgt aggtgtgccg ggtgttggtg tgccgggtgt tggtgtacca 120 
ggtggcggtg ttccgggtgc aggcgttccg ggtggcggtg tgccgggcgg gctggcggcc 180 
q C 182 
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<210> 42 

<211> 332 

<212> DNA 

<213> Kunstliche Sequenz 



<220> 

<223> Beschreibung der kunstlichen Sequenz :ELP mit 20 
Pent amereinhei ten 



<400> 42 

ctcgagatgg gccacggcgt gggtgttccg 
ggcgcaggtg ttcctggtgt aggtgtgccg 
ggtggcggtg ttccgggtgc aggcgttccg 
ggcgtgggtg ttccgggtgg cggtgtgccg 
ggtgttggtg tgccgggtgt tggtgtacca 
ggtggcggtg tgccgggcgg gctggcggcc 



ggcgtgggtg ttccgggtgg cggtgtgccg 60 
ggtgttggtg tgccgggtgt tggtgtacca 120 
ggtggcggtg tgccgggcgt gggtgttccg 180 
ggcgcaggtg ttcctggtgt aggtgtgccg 240 
ggtggcggtg ttccgggtgc aggcgttccg 300 
gc 332 



<210> 43 
<211> 482 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz :ELP mit 30 
Pentamereinheiten 

<400> 43 

ctcgagatgg gccacggcgt gggtgttccg ggcgtgggtg ttccgggtgg cggtgtgccg 60 

ggcgcaggtg ttcctggtgt aggtgtgccg ggtgttggtg tgccgggtgt tggtgtacca 120 

ggtggcggtg ttccgggtgc aggcgttccg ggtggcggtg tgccgggcgt gggtgttccg 180 

ggcgtgggtg ttccgggtgg cggtgtgccg ggcgcaggtg ttcctggtgt aggtgtgccg 240 

ggtgttggtg tgccgggtgt tggtgtacca ggtggcggtg ttccgggtgc aggcgttccg 300 

ggtggcggtg tgccgggcgt gggtgttccg ggcgtgggtg ttccgggtgg cggtgtgccg 360 

ggcgcaggtg ttcctggtgt aggtgtgccg ggtgttggtg tgccgggtgt tggtgtacca 420 

ggtggcggtg ttccgggtgc aggcgttccg ggtggcggtg tgccgggcgg gctggcggcc 4 80 
g C 482 



<210> 44 
<211> 632 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz :ELP mit 40 
Pe n t ame re i nhe i t en 
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<400> 44 

ctcgagatgg gccacggcgt 
ggcgcaggtg ttcctggtgt 
ggtggcggtg ttccgggtgc 
ggcgtgggtg ttccgggtgg 
ggtgttggtg tgccgggtgt 
ggtggcggtg tgccgggcgt 
ggcgcaggtg ttcctggtgt 
ggtggcggtg ttccgggtgc 
ggcgtgggtg ttccgggtgg 
ggtgttggtg tgccgggtgt 
ggtggcggtg tgccgggcgg 



gggtgttccg ggcgtgggtg 
aggtgtgccg ggtgttggtg 
aggcgttccg ggtggcggtg 
cggtgtgccg ggcgcaggtg 
tggtgtacca ggtggcggtg 
gggtgttccg ggcgtgggtg 
aggtgtgccg ggtgttggtg 
aggcgttccg ggtggcggtg 
cggtgtgccg ggcgcaggtg 
tggtgtacca ggtggcggtg 
gctggcggcc gc 



ttccgggtgg cggtgtgccg 60 
tgccgggtgt tggtgtacca 120 
tgccgggcgt gggtgttccg 180 
ttcctggtgt aggtgtgccg 240 
ttccgggtgc aggcgttccg 300 
ttccgggtgg cggtgtgccg 360 
tgccgggtgt tggtgtacca 420 
tgccgggcgt gggtgttccg 480 
ttcctggtgt aggtgtgccg 54 0 
ttccgggtgc aggcgttccg 600 

632 



<210> 45 
<211> 932 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz :ELP mit 60 
Pentamereinheiten 

<400> 45 

ctcgagatgg gccacggcgt gggtgttccg ggcgtgggtg ttccgggtgg cggtgtgccg 60 
ggcgcaggtg ttcctggtgt aggtgtgccg ggtgttggtg tgccgggtgt tggtgtacca 120 
ggtggcggtg ttccgggtgc aggcgttccg ggtggcggtg tgccgggcgt gggtgttccg 180 
ggcgtgggtg ttccgggtgg cggtgtgccg ggcgcaggtg ttcctggtgt aggtgtgccg 240 
ggtgttggtg tgccgggtgt tggtgtacca ggtggcggtg ttccgggtgc aggcgttccg 300 
ggtggcggtg tgccgggcgt gggtgttccg ggcgtgggtg ttccgggtgg cggtgtgccg 3 60 
ggcgcaggtg ttcctggtgt aggtgtgccg ggtgttggtg tgccgggtgt tggtgtacca 420 
ggtggcggtg ttccgggtgc aggcgttccg ggtggcggtg tgccgggcgt gggtgttccg 480 
ggcgtgggtg ttccgggtgg cggtgtgccg ggcgcaggtg ttcctggtgt aggtgtgccg 540 
ggtgttggtg tgccgggtgt tggtgtacca ggtggcggtg ttccgggtgc aggcgttccg 600 
ggtggcggtg tgccgggcgt gggtgttccg ggcgtgggtg ttccgggtgg cggtgtgccg 660 
ggcgcaggtg ttcctggtgt aggtgtgccg ggtgttggtg tgccgggtgt tggtgtacca 720 
ggtggcggtg ttccgggtgc aggcgttccg ggtggcggtg tgccgggcgt gggtgttccg 780 
ggcgtgggtg ttccgggtgg cggtgtgccg ggcgcaggtg ttcctggtgt aggtgtgccg 840 
ggtgttggtg tgccgggtgt tggtgtacca ggtggcggtg ttccgggtgc aggcgttccg 900 
ggtggcggtg tgccgggcgg gctggcggcc gc 932 



<210> 46 
<211> 1082 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 
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<223> Beschreibung der kunstlichen Sequenz :ELP mit 70 
Pentamereinheiten 

<400> 46 

ctcgagatgg gccacggcgt gggtgttccg ggcgtgggtg ttccgggtgg cggtgtgccg 60 

ggcgcaggtg ttcctggtgt aggtgtgccg ggtgttggtg tgccgggtgt tggtgtacca 120 

ggtggcggtg ttccgggtgc aggcgttccg ggtggcggtg tgccgggcgt gggtgttccg 180 

ggcgtgggtg ttccgggtgg cggtgtgccg ggcgcaggtg ttcctggtgt aggtgtgccg 240 

ggtgttggtg tgccgggtgt tggtgtacca ggtggcggtg ttccgggtgc aggcgttccg 300 

ggtggcggtg tgccgggcgt gggtgttccg ggcgtgggtg ttccgggtgg cggtgtgccg 360 

ggcgcaggtg ttcctggtgt aggtgtgccg ggtgttggtg tgccgggtgt tggtgtacca 420 

ggtggcggtg ttccgggtgc aggcgttccg ggtggcggtg tgccgggcgt gggtgttccg 480 

ggcgtgggtg ttccgggtgg cggtgtgccg ggcgcaggtg ttcctggtgt aggtgtgccg 540 

ggtgttggtg tgccgggtgt tggtgtacca ggtggcggtg ttccgggtgc aggcgttccg 600 

ggtggcggtg tgccgggcgt gggtgttccg ggcgtgggtg ttccgggtgg cggtgtgccg 660 

ggcgcaggtg ttcctggtgt aggtgtgccg ggtgttggtg tgccgggtgt tggtgtacca 720 

ggtggcggtg ttccgggtgc aggcgttccg ggtggcggtg tgccgggcgt gggtgttccg 780 

ggcgtgggtg ttccgggtgg cggtgtgccg ggcgcaggtg ttcctggtgt aggtgtgccg 840 

ggtgttggtg tgccgggtgt tggtgtacca ggtggcggtg ttccgggtgc aggcgttccg 900 

ggtggcggtg tgccgggcgt gggtgttccg ggcgtgggtg ttccgggtgg cggtgtgccg 960 

ggcgcaggtg ttcctggtgt aggtgtgccg ggtgttggtg tgccgggtgt tggtgtacca 102a 

ggtggcggtg ttccgggtgc aggcgttccg ggtggcggtg tgccgggcgg gctggcggcc 1080 
gc 1082 



<210> 47 
<211> 1532 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz :ELP mit 100 
Pent ante re i nhe i t en 

<400> 47 

ctcgagatgg gccacggcgt gggtgttccg ggcgtgggtg ttccgggtgg cggtgtgccg 60 

ggcgcaggtg ttcctggtgt aggtgtgccg ggtgttggtg tgccgggtgt tggtgtacca 120 

ggtggcggtg ttccgggtgc aggcgttccg ggtggcggtg tgccgggcgt gggtgttccg 180 

ggcgtgggtg ttccgggtgg cggtgtgccg ggcgcaggtg ttcctggtgt aggtgtgccg 240 

ggtgttggtg tgccgggtgt tggtgtacca ggtggcggtg ttccgggtgc aggcgttccg 300 

ggtggcggtg tgccgggcgt gggtgttccg ggcgtgggtg ttccgggtgg cggtgtgccg 360 

ggcgcaggtg ttcctggtgt aggtgtgccg ggtgttggtg tgccgggtgt tggtgtacca 420 

ggtggcggtg ttccgggtgc aggcgttccg ggtggcggtg tgccgggcgt gggtgttccg 480 

ggcgtgggtg ttccgggtgg cggtgtgccg ggcgcaggtg ttcctggtgt aggtgtgccg 540 

ggtgttggtg tgccgggtgt tggtgtacca ggtggcggtg ttccgggtgc aggcgttccg 600 

ggtggcggtg tgccgggcgt gggtgttccg ggcgtgggtg ttccgggtgg cggtgtgccg 660 

ggcgcaggtg ttcctggtgt aggtgtgccg ggtgttggtg tgccgggtgt tggtgtacca 720 

ggtggcggtg ttccgggtgc aggcgttccg ggtggcggtg tgccgggcgt gggtgttccg 780 
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ggcgtgggtg ttccgggtgg cggtgtgccg 
ggtgttggtg tgccgggtgt tggtgtacca 
ggtggcggtg tgccgggcgt gggtgttccg 
ggcgcaggtg ttcctggtgt aggtgtgccg 
ggtggcggtg ttccgggtgc aggcgttccg 
ggcgtgggtg ttccgggtgg cggtgtgccg 
ggtgttggtg tgccgggtgt tggtgtacca 
ggtggcggtg tgccgggcgt gggtgttccg 
ggcgcaggtg ttcctggtgt aggtgtgccg 
ggtggcggtg ttccgggtgc aggcgttccg 
ggcgtgggtg ttccgggtgg cggtgtgccg 
ggtgttggtg tgccgggtgt tggtgtacca 
ggtggcggtg tgccgggcgg gctggcggcc 



ggcgcaggtg ttcctggtgt aggtgtgccg 840 
ggtggcggtg ttccgggtgc aggcgttccg 900 
ggcgtgggtg ttccgggtgg cggtgtgccg 960 
ggtgttggtg tgccgggtgt tggtgtacca 1020 
ggtggcggtg tgccgggcgt gggtgttccg 1080 
ggcgcaggtg ttcctggtgt aggtgtgccg 1140 
ggtggcggtg ttccgggtgc aggcgttccg 1200 
ggcgtgggtg ttccgggtgg cggtgtgccg 1260 
ggtgttggtg tgccgggtgt tggtgtacca 1320 
ggtggcggtg tgccgggcgt gggtgttccg 1380 
ggcgcaggtg ttcctggtgt aggtgtgccg 144 0 
ggtggcggtg ttccgggtgc aggcgttccg 1500 
gc 1532 



<210> 48 
<211> 2322 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz -.SM12- 7 OxELP 
(Pf lanzen) 

<400> 48 

atggcttcca aaccttttct atctttgctt tcactttcct tgcttctctt tacaagcaca 60 
tgtttagcag gatcccagtt acccgggcag ggaggttatg gtggtctggg gggccagggt 120 
gctggccaag gaggttatgg tggtctgggg agtcagggcg ctggtcgtgg gggactgggt 180 
ggccaaggtg caggagctgc tgctgcagct gcaggtggag ccgggcaggg aggtctggga 240 
gggcagggag cgggccaagg tgcaggagca gctgcagcag ctgcaggtgg agccgggcag 300 
ggaggttatg gtggtctggg gagtcagggc gctggtcgtg ggggactggg tggccaaggt 360 
gcaggagcag ctgcagctgc tgcaggtgga gccgggcagg gaggttatgg tggtctgggg 420 
agtcagggtg ctggtcgtgg aggccaaggt gcaggagctg cagcagcagc tgcaggtgga 480 
gccgggcagg gaggttatgg tggtctgggg agtcagggcg ctggtcgtgg gggactgggt 54 0 
ggccaaggtg caggagcagc tgcagctgct gcaggtggag ccgggcaggg aggttatggt 600 
ggtctgggga gtcagggtgc tggtcgtgga ggccaaggtg caggagctgc agcagcagct 660 
gcaggtggag ccgggcaggg aggttatggt ggtctgggga gtcagggtgc tggtcgtgga 720 
ggccaaggtg caggagctgc agcagcagct gcaggtggag ccgggcaggg aggttatggt 780 
ggtctggggg gccagggtgc tggccaagga ggttatggtg gtctggggag tcagggcgct 84 0 
ggtcgtgggg gactgggtgg ccaaggtgca ggagctgctg ctgcagctgc aggtggagcc 900 
gggcagggag gtctgggagg gcagggagcg ggccaaggtg caggagcagc tgcagcagct 960 
gcaggtggag ccgggcaggg aggttatggt ggtctgggga gtcagggtgc tggtcgtgga 102 0 
ggccaaggtg caggagctgc agcagcagct gcaggtggag ccgggcaggg aggttatggt 1080 
ggtctgggga gtcagggcgc tggtcgtggg ggactgggtg gccaaggtgc aggagcagct 114 0 
gcagctgctg caggtggagc cggcggacaa gcggccgcag aacaaaaact catctcagaa 1200 
gaggatctga atggggccgt cgagatgggc cacggcgtgg gtgttccggg cgtgggtgtt 1260 
ccgggtggcg gtgtgccggg cgcaggtgtt cctggtgtag gtgtgccggg tgttggtgtg 1320 
ccgggtgttg gtgtaccagg tggcggtgtt ccgggtgcag gcgttccggg tggcggtgtg 13 80 
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ccgggcgtgg gtgttccggg cgtgggtgtt 
cctggtgtag gtgtgccggg tgttggtgtg 
ccgggtgcag gcgttccggg tggcggtgtg 
ccgggtggcg gtgtgccggg cgcaggtgtt 
ccgggtgttg gtgtaccagg tggcggtgtt 
ccgggcgtgg gtgttccggg cgtgggtgtt 
cctggtgtag gtgtgccggg tgttggtgtg 
ccgggtgcag gcgttccggg tggcggtgtg 
ccgggtggcg gtgtgccggg cgcaggtgtt 
cc 999tgttg gtgtaccagg tggcggtgtt 
ccgggcgtgg gtgttccggg cgtgggtgtt 
cctggtgtag gtgtgccggg tgttggtgtg 
ccgggtgcag gcgttccggg tggcggtgtg 
ccgggtggcg gtgtgccggg cgcaggtgtt 
ccgggtgttg gtgtaccagg tggcggtgtt 
ccgggcgggc tggcggccgc agaacccaaa 



ccgggtggcg gtgtgccggg cgcaggtgtt 1440 
ccgggtgttg gtgtaccagg tggcggtgtt 1500 
ccgggcgtgg gtgttccggg cgtgggtgtt 1560 
cctggtgtag gtgtgccggg tgttggtgtg 1620 
ccgggtgcag gcgttccggg tggcggtgtg 1680 
ccgggtggcg gtgtgccggg cgcaggtgtt 1740 
ccgggtgttg gtgtaccagg tggcggtgtt 1800 
ccgggcgtgg gtgttccggg cgtgggtgtt 1860 
cctggtgtag gtgtgccggg tgttggtgtg 1920 
ccgggtgcag gcgttccggg tggcggtgtg 1980 
ccgggtggcg gtgtgccggg cgcaggtgtt 2040 
ccgggtgttg gtgtaccagg tggcggtgtt 2100 
ccgggcgtgg gtgttccggg cgtgggtgtt 2160 
cctggtgtag gtgtgccggg tgttggtgtg 2220 
ccgggtgcag gcgttccggg tggcggtgtg 2280 
gacgaactct ag 2322 



<210> 49 
<211> 773 
<212> PRT 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : SM12-70xELP 
(Pflanzen) 

<400> 49 

Met Ala Ser Lys Pro Phe Leu Ser Leu Leu Ser Leu Ser Leu Leu Leu 
15 10 15 

Phe Thr Ser Thr Cys Leu Ala Gly Ser Gin Leu Pro Gly Gin Gly Gly 
20 25 30 

Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Gly Tyr Gly Gly 
35 40 45 

Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala 
50 55 60 

Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Leu Gly 
65 70 75 80 

Gly Gin Gly Ala Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly 
85 90 95 

Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly 
100 105 110 • 
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Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala 
115 120 125 

Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala 
130 135 140 

Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly 
145 150 155 160 

Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg 
165 170 175 

Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly 
180 185 190 

Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly 
195 200 205 

Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala 
210 215 220 

Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly 
225 230 235 240 

Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin 
245 250 255 

Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Gly Tyr 
260 265 270 

Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin 
275 280 285 

Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly 
290 295 300 

Leu Gly Gly Gin Gly Ala Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala 
305 310 315 320 

Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly 
325 330 335 

Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly 
340 345 350 



Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly 
355 360 365 
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Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala 
370 375 380 

5 

Gly Gly Ala Gly Gly Gin Ala Ala Ala Glu Gin Lys Leu He Ser Glu 
385 390 395 400 

io Glu Asp Leu Asn Gly Ala Val Glu Met Gly His Gly Val Gly Val Pro 
405 410 415 



15 



Gly Val Gly Val Pro Gly Gly Gly Val Pro Gly Ala Gly Val Pro Gly 



420 



425 



430 



20 



Val Gly Val Pro Gly Val Gly Val Pro Gly Val Gly Val Pro Gly Gly 
435 440 445 



25 



30 



Gly Val Pro Gly Ala Gly Val Pro Gly Gly Gly Val Pro Gly Val Gly 
450 455 460 

Val Pro Gly Val Gly Val Pro Gly Gly Gly Val Pro Gly Ala Gly Val 
465 470 475 480 

Pro Gly Val Gly Val Pro Gly Val Gly Val Pro Gly Val Gly Val Pro 
485 490 495 



35 Gly Gly Gly Val Pro Gly Ala Gly Val Pro Gly Gly Gly Val Pro Gly 
500 505 510 



Val Gly Val Pro Gly Val Gly Val Pro Gly Gly Gly Val Pro Gly Ala 



40 



515 



520 



525 



45 



Gly Val Pro Gly Val Gly Val Pro Gly Val Gly Val Pro Gly Val Gly 
530 535 540 



50 



Val Pro Gly Gly Gly Val Pro Gly Ala Gly Val Pro Gly Gly Gly Val 
545 550 555 560 

Pro Gly Val Gly Val Pro Gly Val Gly Val Pro Gly Gly Gly Val Pro 
565 570 575 



55 



Gly Ala Gly Val Pro Gly Val Gly Val Pro Gly Val Gly Val Pro Gly 
580 585 590 



60 Val Gly Val Pro Gly Gly Gly Val Pro Gly Ala Gly Val Pro Gly Gly 
595 600 605 



Gly Val Pro Gly Val Gly Val Pro Gly Val Gly Val Pro Gly Gly Gly 
65 610 615 620 
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Val Pro Gly Ala Gly Val Pro Gly Val Gly Val Pro Gly Val Gly Val 
625 630 635 640 

Pro Gly Val Gly Val Pro Gly Gly Gly Val Pro Gly Ala Gly Val Pro 
645 650 655 

Gly Gly Gly Val Pro Gly Val Gly Val Pro Gly Val Gly Val Pro Gly 
660 665 670 

Gly Gly Val Pro Gly Ala Gly Val Pro Gly Val Gly Val Pro Gly Val 
675 680 685 

Gly Val Pro Gly Val Gly Val Pro Gly Gly Gly Val Pro Gly Ala Gly 
690 695 700 

Val Pro Gly Gly Gly Val Pro Gly Val Gly Val Pro Gly Val Gly Val 
705 710 715 720 

Pro Gly Gly Gly Val Pro Gly Ala Gly Val Pro Gly Val Gly Val Pro 
725 730 735 

Gly Val Gly Val Pro Gly Val Gly Val Pro Gly Gly Gly Val Pro Gly 
740 745 750 

Ala Gly Val Pro Gly Gly Gly Val Pro Gly Gly Leu Ala Ala Ala Glu 
755 760 765 



Pro Lys Asp Glu Leu 
770 



<210> 50 
<211> 2334 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : SM12 -70xELP 
(E.coli) 



<400> 50 

atggctagca tgactggtgg acagcaaatg 
ggttatggtg gtctgggggg ccagggtgct 
cagggcgctg gtcgtggggg actgggtggc 
ggtggagccg ggcagggagg tctgggaggg 
gcagcagctg caggtggagc cgggcaggga 
ggtcgtgggg gactgggtgg ccaaggtgca 



ggtcgcggat cccagttacc cgggcaggga 60 
ggccaaggag gttatggtgg tctggggagt 120 
caaggtgcag gagctgctgc tgcagctgca 180 
cagggagcgg gccaaggtgc aggagcagct 24 0 
ggttatggtg gtctggggag tcagggcgct 300 
ggagcagctg cagctgctgc aggtggagcc 360 
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gggcagggag gttatggtgg tctggggagt 
ggagctgcag cagcagctgc aggtggagcc 
cag'ggcgctg gtcgtggggg actgggtggc 
ggtggagccg ggcagggagg ttatggtggt 
caaggtgcag gagctgcagc agcagctgca 
ctggggagtc agggtgctgg tcgtggaggc 
ggtggagccg ggcagggagg ttatggtggt 
tatggtggtc tggggagtca gggcgctggt 
gctgctgctg cagctgcagg tggagccggg 
caaggtgcag gagcagctgc agcagctgca 
ctggggagtc agggtgctgg tcgtggaggc 
ggtggagccg ggcagggagg ttatggtggt 
ctgggtggcc aaggtgcagg agcagctgca 
gccgcagaac aaaaactcat ctcagaagag 
ggcgtgggtg ttccgggcgt gggtgttccg 
ggtgtaggtg tgccgggtgt tggtgtgccg 
ggtgcaggcg ttccgggtgg cggtgtgccg 
ggtggcggtg tgccgggcgc aggtgttcct 
ggtgttggtg taccaggtgg cggtgttccg 
ggcgtgggtg ttccgggcgt gggtgttccg 
ggtgtaggtg tgccgggtgt tggtgtgccg 
ggtgcaggcg ttccgggtgg cggtgtgccg 
ggtggcggtg tgccgggcgc aggtgttcct 
ggtgttggtg taccaggtgg cggtgttccg 
ggcgtgggtg ttccgggcgt gggtgttccg 
ggtgtaggtg tgccgggtgt tggtgtgccg 
ggtgcaggcg ttccgggtgg cggtgtgccg 
ggtggcggtg tgccgggcgc aggtgttcct 
ggtgttggtg taccaggtgg cggtgttccg 
ggcgtgggtg ttccgggcgt gggtgttccg 
ggtgtaggtg tgccgggtgt tggtgtgccg 
ggtgcaggcg ttccgggtgg cggtgtgccg 
atctcagaag aggatctgaa tggggccgtc 



cagggtgctg 


gtcgtggagg 


ccaaggtgca 


420 


gggcagggag 


gttatggtgg 


tctggggagt 


480 


caaggtgcag 


gagcagctgc 


agctgctgca 


540 


ctggggagtc 


agggtgctgg 


tcgtggaggc 


600 


ggtggagccg 


ggcagggagg 


ttatggtggt 


660 


caaggtgcag 


gagctgcagc 


agcagctgca 


720 


ctggggggcc 


agggtgctgg 


ccaaggaggt 


780 


cgtgggggac 


tgggtggcca 


aggtgcagga 


840 


cagggaggtc 


tgggagggca 


gggagcgggc 


900 


ggtggagccg 


ggcagggagg 


ttatggtggt 


960 


caaggtgcag 


gagctgcagc 


agcagctgca 


1020 


ctggggagtc 


a gggcgctgg 


tcgtggggga 


1080 


gctgctgcag 


gtggagccgg 


cggacaagcg 


1140 


gatctgaatg 


gggccgtcga 


gatgggccac 


1200 


ggtggcggtg 


tgccgggcgc 


aggtgttcct 


1260 


ggtgttggtg 


taccaggtgg 


cggtgttccg 


1320 


ggcgtgggtg 


ttccgggcgt 


gggtgttccg 


1380 


ggtgtaggtg 


tgccgggtgt 


tggtgtgccg 


1440 


ggtgcaggcg 


ttccgggtgg 


cggtgtgccg 


1500 


ggtggcggtg 


tgccgggcgc 


aggtgttcct 


1560 


ggtgttggtg 


taccaggtgg 


cggtgttccg 


1620 


ggcgtgggtg 


ttccgggcgt 


gggtgttccg 


1680 


ggtgtaggtg 


tgccgggtgt 


tggtgtgccg 


1740 


ggtgcaggcg 


ttccgggtgg 


cggtgtgccg 


1800 


ggtggcggtg 


tgccgggcgc 


aggtgttcct 


1860 


ggtgttggtg 


taccaggtgg 


cggtgttccg 


1920 


ggcgtgggtg 


ttccgggcgt 


gggtgttccg 


1980 


ggtgtaggtg 


tgccgggtgt 


tggtgtgccg 


2040 


ggtgcaggcg 


ttccgggtgg 


cggtgtgccg 


2100 


ggtggcggtg 


tgccgggcgc 


aggtgttcct 


2160 


ggtgttggtg 


taccaggtgg 


cggtgttccg 


2220 


ggcgggctgg 


cggccgcaga 


acaaaaactc 


2280 


gagcaccacc 


accaccacca 


ctga 


2334 



<210> 51 
<211> 777 
<212> PRT 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunst lichen Sequenz : SM12-70xELP 
(E.coli) 

<400> 51 

Met Ala Ser Met Thr Gly Gly Gin Gin Met Gly Arg Gly Ser Gin Leu 
15 10 15 
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Pro Gly Gin Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin 
20 25 30 

Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Leu 
35 40 45 



Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly 
50 55 60 



10 



Gin Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Ala. Gly Ala Ala 
65 70 75 80 



15 



Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly 
85 90 95 



20 



Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala 
100 105 110 

Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu 
115 120 125 

Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala 
130 135 140 



25 



30 



Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser 
145 150 155 160 



35 



Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala 
165 170 175 



40 



Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly 
180 185 190 



45 



Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala 
195 200 205 

Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin 
210 215 220 



50 



Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala 
225 230 235 240 



55 



Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly Gly Gin Gly Ala 
245 250 255 



60 



Gly Gin Gly Gly Tyr Gly Gly Leu Gly Ser Gin Gly Ala Gly Arg Gly 
260 265 270 



65 
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Gly Leu Gly Gly Gin Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly 
275 280 285 

5 Ala Gly Gin Gly Gly Leu Gly Gly Gin Gly Ala Gly Gin Gly Ala Gly 
290 295 300 

to Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly 
305 310 315 320 



15 



Leu Gly Ser Gin Gly Ala Gly Arg Gly Gly Gin Gly Ala Gly Ala Ala 



325 



330 



335 



20 



Ala Ala Ala Ala Gly Gly Ala Gly Gin Gly Gly Tyr Gly Gly Leu Gly 
340 345 350 



25 



30 



Ser Gin Gly Ala Gly Arg Gly Gly Leu Gly Gly Gin Gly Ala Gly Ala 
355 360 365 

Ala Ala Ala Ala Ala Gly Gly Ala Gly Gly Gin Ala Ala Ala Glu Gin 
370 375 380 

Lys Leu lie Ser Glu Glu Asp Leu Asn Gly Ala Val Glu Met Gly His 
385 390 395 400 



35 Gly Val Gly Val Pro Gly Val Gly Val Pro Gly Gly Gly Val Pro Gly 
405 410 415 



40 



Ala Gly Val Pro Gly Val Gly Val Pro Gly Val Gly Val Pro Gly Val 



420 



425 



430 



45 



Gly Val Pro Gly Gly Gly Val Pro Gly Ala Gly Val Pro Gly Gly Gly 
435 440 445 



50 



Val Pro Gly Val Gly Val Pro Gly Val Gly Val Pro Gly Gly Gly Val 

450 455 460 

Pro Gly Ala Gly Val Pro Gly Val Gly Val Pro Gly Val Gly Val Pro 

465 470 475 480 



55 



Gly Val Gly Val Pro Gly Gly Gly Val Pro Gly Ala Gly Val Pro Gly 
485 490 495 



60 Gly Gly Val Pro Gly Val Gly Val Pro Gly Val Gly Val Pro Gly Gly 
500 505 510 



Gly Val Pro Gly Ala Gly Val Pro Gly Val Gly Val Pro Gly Val Gly 
65 515 520 525 
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Val Pro Gly Val Gly Val Pro Gly Gly Gly Val Pro Gly Ala Gly Val 
530 535 540 

Pro Gly Gly Gly Val Pro Gly Val Gly Val Pro Gly Val Gly Val Pro 

545 550 555 560 



Gly Gly Gly Val Pro Gly Ala Gly Val Pro Gly Val Gly Val Pro Gly 
565 570 575 



to 



Val Gly Val Pro Gly Val Gly Val Pro Gly Gly Gly Val Pro Gly Ala 
580 585 590 



L5 



Gly Val Pro Gly Gly Gly Val Pro Gly Val Gly Val Pro Gly Val Gly 
595 600 605 



20 



Val Pro Gly Gly Gly Val Pro Gly Ala Gly Val Pro Gly Val Gly Val 
610 615 620 

Pro Gly Val Gly Val Pro Gly Val Gly Val Pro Gly Gly Gly Val Pro 
625 630 635 640 

Gly Ala Gly Val Pro Gly Gly Gly Val Pro Gly Val Gly Val Pro Gly 
645 650 655 



25 



30 



Val Gly Val Pro Gly Gly Gly Val Pro Gly Ala Gly Val Pro Gly Val 
660 665 670 



35 



Gly Val Pro Gly Val Gly Val Pro Gly Val Gly Val Pro Gly Gly Gly 
675 680 685 



40 



Val Pro Gly Ala Gly Val Pro Gly Gly Gly Val Pro Gly Val Gly Val 
690 695 700 



45 



Pro Gly Val Gly Val Pro Gly Gly Gly Val Pro Gly Ala Gly Val Pro 

705 710 715 720 

Gly Val Gly Val Pro Gly Val Gly Val Pro Gly Val Gly Val Pro Gly 

725 730 735 



50 



Gly Gly Val Pro Gly Ala Gly Val Pro Gly Gly Gly Val Pro Gly Gly 
740 745 750 



55 



Leu Ala Ala Ala Glu Gin Lys Leu He Ser Glu Glu Asp Leu Asn Gly 
755 760 765 



60 



Ala Val Glu His His His His His His 
770 775 



65 



65 
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Patentanspriiche 

1 . DNA-Sequenz, die fur ein synthetisches Spinnenseidenprotein kodiert, dadurch gekennzeichnet, daB die DNA- 
Sequenz aus Modulen aufgebaut ist, die eine Gruppe von aneinandergereihten Oligonukleotidsequenzen umfassen, 

5 wobei die Oligonukleotidsequenzen jeweils fiir repetitive Einheiten aus Spidroin-Proteinen kodieren, mit der MaB- 

gabe, daB das durch die DNA-Sequenz kodierte Protein eine mindestens 84%ige, vorzugsweise mindestens 90%ige, 
besonders bevorzugt mindestens 94%ige Homologie zu Spidroin-Proteinen, insbesondere zu dem Spidroin 1 -Pro- 
tein, besonders bevorzugt zu dem Spidroin 1-Protein aus Nephila clavipes aufweist. 

2. DNA-Sequenz nach Anspruch 1, dadurch gekennzeichnet, daB die Oligonukleotidsequenzen ausgewahlt sind 
10 aus der Gruppe, bestehend aus: 

a) TATGAGCGCTCCCGGGCAGGGT, 

b) AGCTTTTAGGTACCAATATTAATCTGGCCGGCTCCACC; 

c) TATGGTCTGGGG; 

d) GGCCAGGGTGCTGGCCAA; 

15 e) GGTGCAGGAGCWGCWGCWGCWGCTGCAGGTGGA; 

f) GCCGGCCAGATTAATATTGGTACCTAAA; 

g) CTGCCCGGG AGCGCTCA ; 

h) ACCACCATAACCTCC; 

i) AGCACCCTGGCCCCCCAG; 

20 j) TGCAGCWGCWGCWGCWGCTCCTGCACCTTGGCC; 

k) TATCAGATCTGGCCAAGGAGGT; 

1) TTGGCC AG ATCTC A ; 

m) AGTCAGGGTGCTGGTCGTGGAGGCCAA; 

n) TCCACGACCAGCACCCTGACTCCCCAG; 
25 o) AGTCAGGGCGCTGGTCGTGGGGGACTGGGTGGCCAA; 

p) ACCCAGTCCCCCACGACCAGCGCCCTGACTCCCCAG; 

q) CTGGGAGGGCAGGGAGCGGGCCAA; 

r) CGCTCCCTGCCCTCCCAGACCTCC; und 

s) Sequenzen, die zu den Sequenzen a) bis r) eine mindestens 80%ige, vorzugsweise mindestens 90%ige, be- 
30 sonders bevorzugt mindestens 94%ige Sequenzidentitat aufweisen. 

3. DNA-Sequenz nach Anspruch 1 oder 2, dadurch gekennzeichnet, daB die Module mindestens 4 Oligonukleotid- 
sequenzen umfassen. 

4. DNA-Sequenz nach einem der vorangehenden Anspriiche, dadurch gekennzeichnet, daB sie aus mindestens 4 
Modulen aufgebaut ist. 

35 5. DNA-Sequenz nach einem der vorangehenden Anspriiche, dadurch gekennzeichnet, daB sie zusatzlich Nuklein- 

sauresequenzen umfaBt, die fiir repetitive Einheiten aus Fibroin-Proteinen, vorzugsweise aus dem Fibroin-Protein 
des Seidenspinners kodieren. 

6. DNA-Sequenz nach einem der vorangehenden Anspriiche, umfassend eine der in SEQ ID No. 19-29 angegebe- 
nen Sequenzen. 

40 7. Rekombinantes Nukleinsauremolekul, umfassend eine DNA-Sequenz nach einem der vorangehenden Ansprii- 

che sowie einen ubiquitar wirkenden Promoter, vorzugsweise den CaMV 35S-Promotor. 

8. Nukleinsauremolekul nach Anspruch 7, zusatzlich umfassend mindestens eine Nukleinsauresequenz, die fiir ein 
pflanzliches Signalpeptid kodiert. 

9. Nukleinsauremolekul nach Anspruch 8, dadurch gekennzeichnet, daB das pflanzliche Signalpeptid den Transport 
45 in das endoplasmatische Retikulum (ER) gewahrleistet. 

10. Nukleinsauremolekul nach Anspruch 8 oder 9, dadurch gekennzeichnet, daB die fiir das pflanzliche Signalpep- 
tid kodierende Nukleinsauresequenz eine LeB4Sp-Sequenz ist. 

1 1 . Nukleinsauremolekul nach einem der Anspriiche 7 bis 10, zusatzlich umfassend eine Nukleinsauresequenz, die 
fur ein ER-Retentionspeptid kodiert. 

50 12. Nukleinsauremolekul nach Anspruch 11, dadurch gekennzeichnet, daB das ER-Retentionspeptid die Sequenz 

KDEL umfaBt. 

13. Nukleinsauremolekul nach einem der Anspriiche 7 bis 10, zusatzlich umfassend eine Nukleinsauresequenz, die 
fur eine Transmembrandomane kodiert 

14. Nukleinsauremolekul nach Anspruch 13, dadurch gekennzeichnet, daB die Nukleinsauresequenz fur die Trans- 
55 membrandomane des PDGF-Rezeptors kodiert. 

15. Nukleinsauremolekul nach einem der Anspriiche 7 bis 14, zusatzlich umfassend eine Nukleinsauresequenz, die 
fur ELFs kodiert. 

1 6. Nukleinsauremolekul nach Anspruch 15, dadurch gekennzeichnet, daB die ELP's von 10 bis 100 Pentamer-Ein- 
heiten umfassen. 

60 17. Nukleinsauremolekul nach Anspruch 15 oder 16, umfassend eine der in SEQ ID No. 48 und 50 angegebenen 

Sequenzen. 

18. Vektor, umfassend ein rekombinantes Nukleinsauremolekul nach einem der Anspriiche 7 bis 17. 

19. Mikroorganismus, enthaltend ein rekombinantes Nukleinsauremolekul oder einen Vektor nach einem der An- 
spriiche 7 bis 18. 

65 20. Rekombinantes Spinnenseidenprotein, kodiert durch eine DNA-Sequenz nach einem der Anspriiche 1 bis 6. 

21. Spinnenseidenprotein nach Anspruch 20, dadurch gekennzeichnet, daB es ein Molekulargewicht im Bereich 
von 10 bis 160 kDa aufweist. 

22. Rekombinantes Spinnenseidenprotein, umfassend eine der in SEQ ID No. 30 bis 40 angegebenen Aminosaure- 
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sequenzen. 

23. Vcrfahren zur Herstellung von Spinncnscidenprotcin-produzierenden Pflanzen bzw. Pfianzenzellen, umfassend 
die folgenden Schritte: 

a) Herstellung eines rekombinanten Nukleinsauremolekiils nach einem der Anspriiche 7 bis 17; 

b) Ubertragung des Nukleinsauremolekiils aus a) auf pflanzliche Zellen; und 5 

c) ggf. die Regeneration fertiler Pflanzen aus den transformierten Pfianzenzellen. 

24. Transgene Pfianzenzellen, enthaltend ein rekombinantes Nukleinsaurernolekul oder einen Vektor nach einem 
der Anspriiche 7 bis 18, oder hergestellt nach einem Verfahren nach Anspruch 23. 

25. Transgene Pflanzen, enthaltend eine Pflanzenzelle nach Anspruch 24 oder hergestellt nach Anspruch 23, sowie 
Teiie dieser Pflanzen, transgene Ernteprodukte und transgencs Vermchrungsmaterial dieser Pflanzen, wie Protopla- 10 
sten, Pfianzenzellen, Kalli, Samen, Knollen, Stecklinge, sowie die transgenen Nachkommen dieser Pflanzen. 

26. Transgene Pflanzen nach Anspruch 25, ausgewahlt aus der Gruppe, bestehend aus Tabakpflanze und Kartoffel- 
pflanze. 

27. Verfahren zur Gewinnung von pflanzlichem Spinnenseidenprotein, umfassend die folgenden Schritte: 

a) die tjbertragung eines rekombinanten Nukleinsauremolekiils oder Vektors nach einem der Anspriiche 7 bis 15 
18 auf Pfianzenzellen; 

b) gegebenenfalls die Regeneration von Pflanzen aus den transformierten Pfianzenzellen; und 

c) die Verarbeitung der Pfianzenzellen aus a) bzw. der Pflanzen aus b) zur Gewinnung von pflanzlichem Spin- 
nenseidenprotein. 

28. Verfahren zur Gewinnung von rckombinant hergeste litem Spinnenseidenprotein, umfassend die folgenden 20 
Schritte: 

a) die Ubertragung eines rekombinanten Nukleinsauremolekiils oder Vektors nach einem der Anspriiche 7 bis 
18 auf Zellen; 

b) die Reinigung des Spinnenseidenproteins durch Hitzebehandlung des Zellextrakts und anschlieBende Ab- 
trennung der denaturierten zelleigenen Proteine. 25 

29. Verfahren zur Gewinnung von rekombinant hergestelltem Spinnenseidenprotein, umfassend die folgenden 
Schritte: 

a) die Ubertragung eines rekombinanten Nukleinsauremolekiils oder Vektors nach einem der Anspriiche 7 bis 
18 auf Zellen; 

b) die Reinigung des pflanzlichen Spinnenseidenproteins durch Einstellung eines sauren pH, vorzugsweise ei- 30 
nes pH im Bereich von 2,5 bis 3,5 mittels Zugabe von Saure, vorzugsweise Salzsaure zu dem Zellextrakt und 
anschlieBende Abtrennung der denaturierten zelleigenen Proteine. 

30. Verfahren zur Gewinnung von rekombinant hergestelltem Spinnenseidenprotein, umfassend die folgenden 
Schritte: 

a) die Ubertragung eines rekombinanten Nukleinsauremolekiils nach einem der Anspriiche 15 bis 17 auf Zcl- 35 
len; 

b) die Reinigung des Spinnenseidenproteins auf foigende Weise: 

- Anreicherung des Spinnenseiden-ELP-Fusionsproteins durch Hitzebehandlung des Zellextrakts; 

- Ausfallung des Spinnenseiden-ELP-Fusionsproteins durch weitere Temperaturerhohung, vorzugs- 
weise auf eine Temperatur von mindestens 60°C, und vorzugsweise bei einer Salzkonzentration von 1 M 40 
bis 2 M; und 

- Abspaltung des ELP-Fragments, vorzugsweise durch Verdauung mit CNBr. 

31 . Verfahren nach einem der Anspriiche 28 bis 30, dadurch gekennzeichnet, daB die Zellen ausgewahlt werden aus 
Pfianzenzellen, tierischen Zellen und bakteriellen Zellen. 

32. Pflanzliches Spinnenseidenprotein, hergestellt nach einem Verfahren nach einem der Anspriiche 27 bis 31 . 45 

33. Spinnenseidenprotein nach Anspruch 32, dadurch gekennzeichnet, daB es ein Molekulargewicht im Bereich 
von 10 bis 160 kDa aufweist. 

34. Vcrwendung der Spinnenseidenproteine nach einem der Anspriiche 20 bis 22 bzw. nach Anspruch 32 oder 33 
zur Herstellung von synthetische Faden, Folien und/oder Membranen. 

35. Verwendung nach Anspruch 34, wobei die Faden, Folien und/oder Membrane fur medizinische Anwendungen, 50 
insbesondere zum Vernahen von Wunden und/oder als Geruste bzw. als Abdeckung fiir kiinstliche Organe, einge- 
setzt werden. 

36. Verwendung nach Anspruch 35, wobei die Folien und/oder Membrane als Anheftungsflachen fur kultivierte 
Zellen und/oder zurFilterung verwendet werden. 

55 
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Nr. des 


Sequenz in 5' to 3' Richtung 


Oligos 




1 


TATGAGCGCTCCCGGGCAGGGT 


2 


AGCTTTTAGGTACCAATATTAATCTGGCCGGCTCCACC 


3 


TATGGTCTGGGG 


4 


GGCCAGGGTGCTGGCCAA 


5 


GGTGCAGGAGCWGCWGCWGCWGCTGCAGGTGGA 


6 


GCCGGCCAGATTAATATTGGTACCTAAA 


7 


CTGCCCGGGAGCGCTCA 


8 


ACCACCATAACCTCC 


9 


AGCACCCTGGCCCCCCAG 


10 


TGCAGCWGCWGCWGCWGCTCCTGCACCTTGGCC 


It 


TATGAGATCTGGCCAAGGAGGT 


12 


TTGGCCAGATCTCA 


13 


AGTCAGGGTGCTGGTCGTGGAGGCCAA 


14 


TCCACGACCAGCACCCTGACTCCCCAG 


15 


AGTCAGGGCGCTGGTCGTGGGGGACTGGGTGGCCAA 


16 


ACCCAGTCCCCCACGACCAGCGCCCTGACTCCCCAG 


17 


CTGGGAGGGCAGGGAGCGGGCGAA 


18 


CGCTCCCTGCCCTCCCAGACCTCC 



Abb. 1 



Protein 


Anordung der Genkassetten aus Abbildung 2 


SD1 


G D B C 


SM12 


GDCBCBBGDBC 


SOI 


HBCBCGDCGDCBCBBGDBC 


SOISOI 


HBCBCGDCGDCBCBBGDBC 




HBCBCGDCGDCBCBBGDBC 


FAl 


G D C B C B B Fibroin 


Abb. 


3 
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Abbildung 2 



Xma 
Nde 



1_3_4_5_6 
7 8 9 10 2 
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Xma 
Nde 



Hindlll 
NgoMIV 
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Hindlll 
NgoMIV 



B 



Xma 
Nde 



Xma 
Nde 



1_3_15_5_6 
7 8 16 10 2 



Hindlll 
NgoMIV 



Sty 
Nde 



1 1_3_15_5 
12_8_I6_10 

Styl 



Hindlll 



1_17_5_6 
7 18 10 2 



Hindlll 
NgoMIV 



D 



Sty 



Nde 



1 1_3_4_5_6 
12_8_9_10_2 

Styl 



Hindlll 



G=A+E 



H=A+F 
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Abb, 4 

I 6 Wo&g <ies Gere aerTran^m^ncto^ne yon HOOK mit Afofl ausJpRT- HOOK) (n (pRTRA 73 syn 'spidofti) 



Wind III (5383) 35S-F*wnotor 




Ko nstruktion der binSren «w m (2W2> s« i (24* ) 

Plasmide (Quelle: pBin19 und/oder p^y* M»/i ( 268i)^yc HO0K 

pGSGIud) mit Spidroin-HOOK 
Expressionskassetten durch 
Transfer von H/nd lll-Fragmenten 
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Int. CI, 7 : C07K 14/435 

Offenlegungstag: 13. Dezember 2001 

Spidroin-ELP-Expressionskassetten fur Escherichia coli 



T7-Promotor c-myc-trnmunotag His-tag 

i 




# synthetlsches Spldroingehif ^ 



^7 



xELP-Efnheiten 

x = (10-100 ELP-Pentamere) 



Spidroin-ELP-Expressionskassetten fur transgene Pflanzen 



35S-Promotor ER-Signalpeptid c-myc-lmmunotag ER-Retentionssignal 

\k ! S (Met) 



I Jj 

^/ 




xELP-Einheiten 

x = (10-100 ELP-Pentamere) 



Abb. 5 
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M/dHI(4230) 




5«il(2502) 



35S- Promoter 
LeB4SP 

^B*rHl(540) 



c-myc KDEL 
Poly A 



pRTRA-BamHI 
NoR (bamhi) 



Seal 



D RTRA73-MutA 



2. Klbnierung syrrthett6cher Spidroingene ats PCR-Produkt QberSamHI j 
und Smal-Erkennungssequenzen (Matnze; synthetische Spidnolngene 

aus p9609 oder p9906 nach Ugierung von ongonukteottden [ON1 t ; 

ON2J als Piimerblndungsstellen) In den Vektor (pRTRA.73 BamHlA) 




Mrd 01(4230) 




Konstruktion der binairen 
Plasmide (Quelle: pBtn19 
und/oder pGSGIud) mit 
Spidroin-Expressionskassetten 
durch Transfer von H/nd III- 
Fragmenten 
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Abb. 7 

*3; ! Vort>eretten von (pRTRA.73 BamHIA) art die direkte Ktonteomg torjsyrithefechen ; ;| 




Hi* 01(4234) 
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Abb. ^8 _ ^ ^ 

Ivektor (pRTRA 73 BamHI+Smal A) fQr cfl« Wontorung syhthetlscher SpWrolngene j 



on Snial und Naaltoden ^ 



//i«mi(42W) 




5. Wonterung der synthetischen Spidroingene Ober.Smal und 
/ Nae\ aus p9609 oder p990S in (pRTRA 73 trunc. scFv) 



P(BLA) 



ff<»»d 111(4037) 



Afe*t(4l37) 



S01 




Konstruktion der binMren 
Plasmide (Quelle: pBin19 
und/oder pGSGIud) mit Spidroin- 

Expressionskassetten durch 
Transfer von H/nd lll-Fragmenten 



Hind III (2745) 
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Abb. 9 

^Generelle Dafo^ 



I. Konstruktion geeigneter pflanzenkompatibler Spidroinexpressionskassetten in Escherichia coli 




HOOK-Truasmembrandomanc 

a. Uberpriirung der Expressionskassetten durch Sequenzierung und/oder Testexpression im 
pet-System in Escherichia coli 

2. Einbringen der Expressionskassetten in 5/?w///e-Vektoren (pBIN19; pGSGluc) in Escherichia coli 

3. Transformation der shuttle-Vd&otsri in Agrobacterium ntmefaciens-Siamme 
a. Uberprufung der Klone durch Southern-Blot-Analyse 

4. Hersteilung transgener Tabak- und Kartoffelpflanzen 

5. Analyse der transgenen Tabak- und Kartoffelpflanzen auf Spidroinproteinexpressioh durch 
immunochemische Detektion eines c-myc-Tags (Western- Analyse) 
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Abb. 10a 

LtB4-Signalpepiid 
KASK?:I*SL 
LSLSLLL5T 

STCLAGSQL? c^GQGGYGGLGGQGAGQGGYGGLGGQGAGQGAGAAAAAAGGAGCC-GYGGLG j> 

^GLGGYGGQGAGGAAAAAAGAGQGGRGAGQS ^ 
^ SQGAGRGGLGGQGAGAAAAAAGGAGQGG YGGLG ^ 
dedtizierce Aminosaureseouenz des ^ GLGGYGGQGAGGAAAAAAGAGQGGRGAGQS ^ 

svnchecischen Fasernroieins SOI ^ S QG AG RGG LGGQG AG AAAAAAGG AGQGG Y GG ZGGQGAGQGS YGG LG «^ 

^ GuGGYGGQGAGGAAAAAAGAGQGAGQGGLGGQGAGGAAAAAAGAGQGGLGGRGAGCS ^ 
^ S QG AGRGGQG AG AAAAAAGG AGQGG YGG LGGQG AGQGG Y GG LG ^ 
^G LGG YGGQGAGGAAAAAAGAGOGAGQGG LGGQG AG GAAAAAAG AGQGG LGGRGAGQS * 
^SQGAGRGGLGGQGAGAAAAAAGGAGQGGYCGLG ^ 
-GG YGGQGAGGAAAAAAG AGQGGRGAGQ S * 



^ S QG AGRGG LGGQGAG AAAAAAGG AGQGG YGG -G ^ 

CG LGG YGGQG AGG AAAAAAG AGQGG RG AGQ S ^ 
S QG AG RGGQG AG AAAAAAGG AGQ GG YGG - GG QG AG C GG Y GG LG « 
p G LGG YGGQGAGGAAAAAAGAGQGAGQGGLGGQGAGGAAAAA^G AGQGG LGG KG AGQ S ' 
^ SQG AG RGGQG AG AAAAAAGG AGQGG YGG LG - 
A A-AAQGGAGGA-A.AAAAG AGQGG LGGRG AGQ S 

Vic:-:l:siedlng3 => :o=±. 
c-mvc-Lmmunotas ER-Retentionssignal 



Abb. 10b 

LeB^-SLsnalpeprid deduzierte Arainosaur eseauenz des 

MASKPFLSL svnthetischen Faserpro teins FA2 

LSLSLL1FT 

STGLAG3QL GQGG YGG 1GG QG AG QGGYGG1G SQG AGRGG LGGQGAG AAAAAAGG AGQGG LG 

C G LGG YGGQG AGGAAAAAAG AG QG AGQG 
SQGAGRGGLGGQGAGAAAAAAGGAG ^ 
AGAGAGAGSAAGSGAGAGYGVGAGAGYGAGYGVGAGAGYGAGAGSGAGAG3GAGAG3GAGAGSGAGAGAG3GAGAGSGS 

GTGSSGFGPYVANGGYSGYI YAWS SKSDrZTAGQ AAA 

IQKLISIIGLNGS K3EL . 
c-myc-lmmunocag ER-Retentionssignal 
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Abb. 11 
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Abb. 13 
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Abb. 15 



ER-Rerentionssignal 



BamH\ Sma\ 



svnihetisches Fasergen 



J5S-Promoror ER-Signalpeprid 



BamH\ Sma\ 



c-myc-Immunotag 

HOOK-Transmembrandomiine 
A'aei Not\ . / Not\^ 



syntbetisches Fasergcn 




35S-Promotor ER-Signalpeptid 



BamH\ Sma\ 



III. 




c-myc-Immunotag 

HOOK-Transmembrandomane 
{Smay&aeVi k'ae\ Sot\ . / Aafl. 



1. syntbetisches Fasergcn I 2. syn. Fasergcn 




c-myc-lmmunotag 
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Abb. 16 



iff 

$ o c ; 

*c j> 

e?* <r* ~* 
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Abbildung 19 



DNA-Sequenz von SM12-70xELP als Pflanzenexpressionskassette 

atggcttccaaaccttttctatctttgctttcactttccttgcttctctttacaagcacatg 
tttagcaggatcccagttacccgggcagggaggttatggtggtctggggggccagggtgctg 
gccaaggaggttatggtggtctggggagtcagggcgctggtcgtgggggactgggtggccaa 
ggtgcaggagctgctgctgcagctgcaggtggagccgggcagggaggtctgggagggcaggg 
agcgggccaaggtgcaggagcagctgcagcagctgcaggtggagccgggcagggaggttatg 
gtggtctggggagtcagggcgctggtcgtgggggactgggtggccaaggtgcaggagcagct 
gcagctgctgcaggtggagccgggcagggaggttatggtggtctggggagtcagggtgctgg 
tcgtggaggccaaggtgcaggagctgcagcagcagctgcaggtggagccgggcagggaggtt 
atggtggtctggggagtcagggcgctggtcgtgggggactgggtggccaaggtgcaggagca 
gctgcagctgctgcaggtggagccgggcagggaggttatggtggtctggggagtcagggtgc 
tggtcgtggaggccaaggtgcaggagctgcagcagcagctgcaggtggagccgggcagggag 
gttatggtggtctggggagtcagggtgctggtcgtggaggccaaggtgcaggagctgcagca 
gcagctgcaggtggagccgggcagggaggttatggtggtctggggggccagggtgctggcca 
aggaggttatggtggtctggggagtcagggcgctggtcgtgggggactgggtggccaaggtg 
caggagctgctgctgcagctgcaggtggagccgggcagggaggtctgggagggcagggagcg 
ggccaaggtgcaggagcagctgcagcagctgcaggtggagccgggcagggaggttatggtgg 
tctggggagtcagggtgctggtcgtggaggccaaggtgcaggagctgcagcagcagctgcag 
gtggagccgggcagggaggttatggtggtctggggagtcagggcgctggtcgtgggggactg 
ggtggccaaggtgcaggagcagctgcagctgctgcaggtggagccggcggacaagcggccgc 
agaacaaaaactcatctcagaagaggatctgaatggggccgtcgagatgggccacggcgtgg 
gtgttccgggcgtgggtgttccgggtggcggtgtgccgggcgcaggtgttcctggtgtaggt 
gtgccgggtgttggtgtgccgggtgttggtgtaccaggtggcggtgttccgggtgcaggcgt 
tccgggtggcggtgtgccgggcgtgggtgttccgggcgtgggtgttccgggtggcggtgtgc 
cgggcgcaggtgttcctggtgtaggtgtgccgggtgttggtgtgccgggtgttggtgtacca 
ggtggcggtgttccgggtgcaggcgttccgggtggcggtgtgccgggcgtgggtgttccggg 
cgtgggtgttccgggtggcggtgtgccgggcgcaggtgttcctggtgtaggtgtgccgggtg 
ttggtgtgccgggtgttggtgtaccaggtggcggtgttccgggtgcaggcgttccgggtggc 
ggtgtgccgggcgtgggtgttccgggcgtgggtgttccgggtggcggtgtgccgggcgcagg 
tgttcctggtgtaggtgtgccgggtgttggtgtgccgggtgttggtgtaccaggtggcggtg 
ttccgggtgcaggcgttccgggtggcggtgtgccgggcgtgggtgttccgggcgtgggtgtt 
ccgggtggcggtgtgccgggcgcaggtgttcctggtgtaggtgtgccgggtgttggtgtgcc 
gggtgttggtgtaccaggtggcggtgttccgggtgcaggcgttccgggtggcggtgtgccgg 
gcgtgggtgttccgggcgtgggtgttccgggtggcggtgtgccgggcgcaggtgttcctggt 
gtaggtgtgccgggtgttggtgtgccgggtgttggtgtaccaggtggcggtgttccgggtgc 
aggcgttccgggtggcggtgtgccgggcgtgggtgttccgggcgtgggtgttccgggtggcg 
gtgtgccgggcgcaggtgttcctggtgtaggtgtgccgggtgttggtgtgccgggtgttggt 
gtaccaggtggcggtgttccgggtgcaggcgttccgggtggcggtgtgccgggcgggctggc 
ggccgcagaacccaaagacgaactctag 
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Abbildung 20 



Proteinsequenz von SM 12-70xELP aus pflanzlicher Expression (SM12, c-myc-Tag, 
70xELP, KDEL - jeweils durch Absatz gekennzeichnet) 

MASKPPLSLLSLSLLLFTSTCLAGSQLPGQGGYGGLGGQGAGQGGYGGLGSQGAGRGGLGGQ 
GAGAAAAAAGGAGQGGLGGQGAGQGAGAAAA/^AGGAGQGGYGGLGSQGAGRGGLGGQGAGAA 
AAAAGGAGQGGYGGLGSQGAGRGGQGAGAAAAAAGGAGQGGYGGLGSQGAGRGGLGGQGAGA 
AAAAAGGAGQGGYGGLGSQGAGRGGQGAGAAAAAAGGAGQGGYGGLGSQGAGRGGQGAGAAA 
AAAGGAGQGGYGGLGGQGAGQGGYGGLGSQGAGRGGLGGQGAGAA7AAAAGGAGQGGLGGQGA 
GQGAGAAAAAAGGAGQGGYGGLGSQGAGRGGQGAGAAAAAAGGAGQGGYGGLGSQGAGRGGL 
GGQGAGAAAAAAGGAGGQAAA 

EQKLISEEDLNGAVE 

MGHGVGVPGVGVPGGGVPGAGVPGVGVPGVGVPGVGVPGGGVPGAGVPGGGVPGVGVPGVGV 
PGGGVPGAGVPGVGVPGVGVPGVGVPGGGVPGAGVPGGGVPGVGVPGVGVPGGGVPGAGVPG 
VGVPGVGVPGVGVPGGGVPGAGVPGGGVPGVGVPGVGVPGGGVPGAGVPGVGVPGVGVPGVG 
VPGGGVPGAGVPGGGVPGVGVPGVGVPGGGVPGAGVPGVGVPGVGVPGVGVPGGGVPGAGVP 
GGGVPGVGVPGVGVPGGGVPGAGVPGVGVPGVGVPGVGVPGGGVPGAGVPGGGVPGVGVPGV 
GVPGGGVPGAGVPGVGVPGVGVPGVGVPGGGVPGAGVPGGGVPGGLAAAEP 



KDEL 
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DNA-Sequenz von SM12-70xELP als Expressionskassette fiir E. coli 

atggctagcatgactggtggacagcaaatgggtcgcggatcccagttacccgggc'agggagg 
ttatggtggtctggggggccagggtgctggccaaggaggttatggtggtctggggagtcagg 
gcgctggtcgtgggggactgggtggccaaggtgcaggagctgctgctgcagctgcaggtgga 
gccgggcagggaggtctgggagggcagggagcgggccaaggtgcaggagcagctgcagcagc 
tgcaggtggagccgggcagggaggttatggtggtctggggagtcagggcgctggtcgtgggg 
gactgggtggccaaggtgcaggagcagctgcagctgctgcaggtggagccgggcagggaggt 
tatggtggtctggggagtcagggtgctggtcgtggaggccaaggtgcaggagctgcagcagc 
agctgcaggtggagccgggcagggaggttatggtggtctggggagtcagggcgctggtcgtg 
ggggactgggtggccaaggtgcaggagcagctgcagctgctgcaggtggagccgggcaggga 
ggttatggtggtctggggagtcagggtgctggtcgtggaggccaaggtgcaggagctgcagc 
agcagctgcaggtggagccgggcagggaggttatggtggtctggggagtcagggtgctggtc 
gtggaggccaaggtgcaggagctgcagcagcagctgcaggtggagccgggcagggaggttat 
ggtggtctggggggccagggtgctggccaaggaggttatggtggtctggggagtcagggcgc 
tggtcgtgggggactgggtggccaaggtgcaggagctgctgctgcagctgcaggtggagccg 
ggcagggaggtctgggagggcagggagcgggccaaggtgcaggagcagctgcagcagctgca 
ggtggagccgggcagggaggttatggtggtctggggagtcagggtgctggtcgtggaggcca 
aggtgcaggagctgcagcagcagctgcaggtggagccgggcagggaggttatggtggtctgg 
ggagtcagggcgctggtcgtgggggactgggtggccaaggtgcaggagcagctgcagctgct 
gcaggtggagccggcggacaagcggccgcagaacaaaaactcatctcagaagaggatctgaa 
tggggccgtcgagatgggccacggcgtgggtgttccgggcgtgggtgttccgggtggcggtg 
tgccgggcgcaggtgttcctggtgtaggtgtgccgggtgttggtgtgccgggtgttggtgta 
ccaggtggcggtgttccgggtgcaggcgttccgggtggcggtgtgccgggcgtgggtgttcc 
gggcgtgggtgttccgggtggcggtgtgccgggcgcaggtgttcctggtgtaggtgtgccgg 
gtgttggtgtgccgggtgttggtgtaccaggtggcggtgttccgggtgcaggcgttccgggt 
ggcggtgtgccgggcgtgggtgttccgggcgtgggtgttccgggtggcggtgtgccgggcgc 
aggtgttcctggtgtaggtgtgccgggtgttggtgtgccgggtgttggtgtaccaggtggcg 
gtgttccgggtgcaggcgttccgggtggcggtgtgccgggcgtgggtgttccgggcgtgggt 
gttccgggtggcggtgtgccgggcgcaggtgttcctggtgtaggtgtgccgggtgttggtgt 
gccgggtgttggtgtaccaggtggcggtgttccgggtgcaggcgttccgggtggcggtgtgc 
cgggcgtgggtgttccgggcgtgggtgttccgggtggcggtgtgccgggcgcaggtgttcct 
ggtgtaggtgtgccgggtgttggtgtgccgggtgttggtgtaccaggtggcggtgttccggg 
tgcaggcgttccgggtggcggtgtgccgggcgtgggtgttccgggcgtgggtgttccgggtg 
gcggtgtgccgggcgcaggtgttcctggtgtaggtgtgccgggtgttggtgtgccgggtgtt 
ggtgtaccaggtggcggtgttccgggtgcaggcgttccgggtggcggtgtgccgggcgtggg 
tgttccgggcgtgggtgttccgggtggcggtgtgccgggcgcaggtgttcctggtgtaggtg 
tgccgggtgttggtgtgccgggtgttggtgtaccaggtggcggtgttccgggtgcaggcgtt 
ccgggtggcggtgtgccgggcgggctggcggccgcagaacaaaaactcatctcagaagagga 
tctgaatggggccgtcgagcaccaccaccaccaccactga 
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Abbildung 22 



Proteinsequenz von SM12-70xELP aus bakterieller Expression (SM12, c-myc-Tag, 
70xELP, c-myc-Tag, HisTag - jeweils durch Absatz gekennzeichnet) 



MASMTGGQQMGRGSQLPGQGGYGGLGGQGAGQGGYGGLGSQGAGRGGLGGQ 

GAGAAAAAAGGAGQGGLGGQGAGQGAGAAAAAAGGAGQGGYGGLGSQGAGRG 

GLGGQGAGAAAAAAGGAGQGGYGGLGSQGAGRGGQGAGAAAAAAGGAGQGGY 

GGLGSQGAGRGGLGGQGAGAAAAAAGGAGQGGYGGLGSQGAGRGGQGAGAAA 

AAAGGAGQGGYGGLGSQGAGRGGQGAGAAAAAAGGAGQGGYGGLGGQGAGQ 

GGYGGLGSQGAGRGGLGGQGAGAAAAAAGGAGQGGLGGQGAGQGAGAAAAAA 

GGAGQGGYGGLGSQGAGRGGQGAGAAAAAAGGAGQGGYGGLGSQGAGRGGL 

GGQGAGAAAAAAGGAGGQAAA 

EQKLISEEDLNGAVE 

MGHGVGVPGVGVPGGGVPGAGVPGVGVPGVGVPGVGVPGGGVPGAGVPGGGV 

PGVGVPGVGVPGGGVPGAGVPGVGVPGVGVPGVGVPGGGVPGAGVPGGGVPG 

VGVPGVGVPGGGVPGAGVPGVGVPGVGVPGVGVPGGGVPGAGVPGGGVPGVG 

VPGVGVPGGGVPGAGVPGVGVPGVGVPGVGVPGGGVPGAGVPGGGVPGVGVP 

GVGVPGGGVPGAGVPGVGVPGVGVPGVGVPGGGVPGAGVPGGGVPGVGVPGV 

GVPGGGVPGAGVPGVGVPGVGVPGVGVPGGGVPGAGVPGGGVPGVGVPGVGV 

PGGGVPGAGVPGVGVPGVGVPGVGVPGGGVPGAGVPGGGVPGGLAAA 

EQKLISEEDLNGAVEHHHHHH. 
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